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Proteines de reserve de p| antes enrichies en acides amines, 
notamment v-zeine de mats enrichie en lysine Plantes exprimant ces 
proteines 

5 La presente demande a pour objet de nouveaux moyens permettant 

la preparation de plantes exprimant des proteines de reserve enrichies en 
acides amines deficitaires dans les proteines de reserve normales, et en 
particulier de proteines de reserves enrichies en lysine. L'invention a 
egalement pour objet les proteines de reserve ainsi modifiees, ainsi que 
10 des plantes exprimant ces proteines de reserve modifiees. 

De nombreuses plantes, le cas echeant apres transformation par 
des etapes physico-chimiques, sont d'une importance economique majeure 
dans I'alimentation humaine ou animale, et le probleme de ('amelioration 
de leur qualite nutritionnelle a deja donne lieu a differents types de 
15 recherches. En particulier, pour remedier a I'insuffisante presence de 
certains acides amines dans les proteines de reserve des plantes. on a mis 
au point des varietes selectionnees presentant des qualites nutritionnelles 
superieures. ou propose differentes modifications faisant appel a 
I'utilisation des techniques du genie genetique afin de favoriser ou 
20 d'augmenter la production dans ces plantes notamment de certains acides 
amines deficitaires, et neanmoins importants pour les qualites 
nutritionnelles de la plante. Ces acides amines deficitaires sont par 
exemple la lysine, la methionine. 

Dans le cadre de la presente demande, les inventeurs se sont 
25 propose d'apporter une solution originale au probleme de Amelioration 
des plantes, notamment de I'amelioration de leurs qualites nutritionnelles 
et ont a cet effet travaille en premier lieu a partir d'une plante d'importance 
economique considerable, le mais. Plus precisement, ils se sont interesses 
aux proteines de reserve de I'endosperme des semences de mais. 
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proteines qui comprennent notamment les zeines et, en particulier, la y- 
zeine. 

Au cours du developpement des semences de mais, les cellules de 
I'endosperme synthetisent de grandes quantites de proteines de reserve, 

5 et notamment de a-, p-, et y-zeines. Ces zeines sont accumulees dans les 
corps proteiques derives du reticulum endoplasmique (ER). 

D'une fagon generate, les zeines represented un groupe complexe 
de proteines, reparties en plusieurs groupes, a-, p-, y- ( et 6-zeines (Larkins 
et at, 1989), codees par une famille multigenique (Hagen et Rubenstein, 

10 1980, Gene 13, 239-249). Bien qu'elles presented une structure variable, 
ces proteines ont des caract6ristiques communes : la presence dans leur 
structure primaire de repetitions en tandem riches en residus d'acides 
amines de type Proline, la presence de nombreux residus hydrophobes qui 
conferent leur insolubility d ces proteines dans un milieu aqueux, et 

15 I'absence de residus lysine, acides amines essentiels pour I'homme et les 
animaux monogastriques. L'absence de lysine dans toutes les prot6ines 
majoritaires (detectees en grande quantite dans I'endosperme) 
naturellement produites de la famille des zeines conduit a une composition 
en acides amines desequilibree dans les semences de mais. 

20 Parmi ces proteines, la y-zeine de mais est une proteine ayant un 

poids moieculaire de 28 kDa, dont la sequence codante a ete decrite sous 
la forme de I'ADNc par Prat et al (Nucleic Acids Research, vol. 13, n° 5, 
1985, p. 1494-1504). La sequence complete du gene codant pour la y- 
zeine, y compris les sequences non codantes en amont et en aval 

25 contenant les elements de regulation de Texpression, a ete decrite par 
Reina, M. et al (Nucleic Acids Research, vol. 18, n° 21, 1990, p6426). 

Jusqu'a present, differentes approches ont 6te envisages pour 
augmenter la teneur en lysine des proteines de la famille des zeines. A cet 
egard, des approches genetiques et moleculaires ont ete mises en oeuvre. 
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Par exemple, des mutants permettant I'obtention de mais riche en lysine, 
tels que ie mutant opaque-2 (o2) et le mutant floury-2 (fl-2) (Mertz et al, 
1964, Science 145, 279-280, Nelson et al, 1965, Science 150, 1469-1470) 
ont ainsi ete proposes et des tentatives pour remedier aux effets nefastes 
5 de I'absence de certaines classes de zeines, notamment les a-zeines, sur 
les caracteristiques phenotypiques, par selection de mais contenant des 
genes modificateurs o2 (Paez et al, 1969, Plant Sci. 9, 251-252, Geetha et 
al, 1991, Plant Cell 3, 1207-1219) ont ete faites. 

Une autre approche a consiste a realiser une action indirecte sur la 

10 production de lysine libre, en particulier dans les plantes dicotyledones. 
Cette technique a ete mise en oeuvre en agissant sur la deregulation des 
enzymes cle (DHTPS et AK) impliquees dans le cycle de la biosynthese de 
la lysine via I'aspartate. Un accroissement sensible des niveaux de lysine 
libre a ete obtenu dans les feuilles. mais pas dans les semences, dans des 

15 experiences de transformation de plantes de tabac avec des bacteries 
Ecpji contenant les genes dapA et des bacteries E. coli contenant le gene 
lysC (Shaul et Galili, 1992, Plant J. 2, 203-209 et 1993, Plant Mol. Biol. 23, 
759-768 ; Perl, A. Schaul O.. Galili, G, 1992, Plant Molecular Biology, 19, 
p. 815-823). Recemment, les memes genes dapA de Corvnebacterium et 

20 lysC de E_cpji ont ete utilises et exprimes sous le controle d'un promoteur 
specifique des semences dans des plantes de soja. L'expression de ces 
deux enzymes dans le soja a conduit a une augmentation de cinq fois de la 
teneur en lysine dans les semences (Falco et al, 1995, BIO-Technology 
13. 577-582). 

55 D'autres auteurs (Wallace et al, 1988, Science 240, 662-664) ont 

tente d'augmenter la lysine dans I'a-zeine (19 kDa) des semences de mais 
en incorporant de facon ponctuelle des residus lysine en differentes 
positions dans la molecule d'a-zeine. L'expression de ces constructions 
dans des oocytes de Xenopus a conduit a I'assemblage correct des zeines 

o riches en lysine dans les vesicules analogues des corps proteiques. 
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Cependant, I'ct-zeine normale et la forme modifiee enrichie en lysine 
etaient degradees lorsqu'elles etaient exprimees dans des semences de 
tabac (Othani et al, 1991, Plant Mol. Biol. 16:117). 

On ne disposait done pas a ce jour de connaissances quant aux 

5 moyens pouvant permettre I'expression d'une zeine enrichie en lysine dans 
les cellules la produisant naturellement dans le mais, e'est-a-dire dans les 
cellules de rendosperme. A fortiori I'expression dans d'autres cellules 
vegetales de zeines enrichies en lysine n'etait pas maitrisee. 

L'un des buts de I'invention est done de proposer des moyens 

10 permettant d'obtenir une zeine enrichie en lysine, en particulier une y-zeine 
de mais enrichie en lysine, cette proteine 6tant exprimee notamment dans 
les cellules des semences de mais et en particulier dans les cellules de 
rendosperme, ladite proteine modifiee etant en outre exprimee de fapon 
telle que ses propri&tes quant a la localisation et ('accumulation au niveau 

is du reticulum endoplasmique et des corps proteiques derives soient 
preservees. 

Uexpression « enrichie en lysine » signifie, dans le contexte de la 
presente demande, que la proteine comporte un nombre augmente de 
residus lysine par rapport a la proteine naturelle dont elle est derivee, par 
20 exemple par suite d'une modification de la sequence de nucleotides qui 
rexprime. 

^invention propose aussi des moyens pour obtenir ('expression de 
proteines, de preference de y-zeines enrichies en lysine, dans des cellules 
vegetales de differents tissus, par exemples des tissus de feuilles ou de 
25 racines, et ce le cas echeant dans des cellules vegetales de plantes 
n'exprimant pas naturellement la proteine, en particulier la y-zeine dont la 
production est recherchee. 
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Par ailleurs, selon un mode de realisation particulier de I'invention, 
d'autres proteines de reserve peuvent etre enrichies en lysine selon des 
modalites analogues. 

Les inventeurs se sont propose dans un premier temps, pour 
5 realiser I'invention, d'introduire dans le gene codant pour la y-zeine ou 
pour d'autres proteines de reserve du mais ou d'autres plantes, ou dans la 
sequence codante de ce gene, des sequences codant pour des 
polypeptides enrichis en lysine, afin d'obtenir la production de y-zeines ou 
d'autres proteines enrichies en lysine et done, de semences enrichies en 
10 lysine. Differents sites de la sequence codante du gene de la y-zeine ont 
ete identifies comme sites permissifs, (appeles encore "sites neutres") pour 
preparer des sequences de nucleotides ainsi modifiees. 

La presente demande propose done des moyens pour transformer le 
gene codant pour la y-zeine de mais ou pour transformer toute sequence 
15 de nucleotides codant pour la y-zeine et derivee de ce gene, de facon a 
obtenir a partir de I'expression du gene modifie ou plus generalement de la 
sequence de nucleotides modifiee, une proteine enrichie en lysine; ces 
moyens comprennent en particulier des oligonucleotides synthetiques 
codant pour une sequence d'acides amines comportant des residus lysine. 
20 L'invention a egalement pour objet des sequences de nucleotides 

recombinantes ou sequences chimeres susceptibles de coder pour une y- 
zeine enrichie en lysine. 

Entrent egalement dans le cadre de I'invention des cellules notes 
transformees par de telles sequences, et en particulier des cellules 
15 vegetales. par exemple des cellules permettant la regeneration de plantes, 
ainsi que des plantes ou des parties de plantes (tissus, organes,...) 
contenant de telles cellules et produisant de facon stable des proteines de 
reserve modifiees, et en particulier des y-zeines enrichies en lysine. 
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L'invention a egalement pour objet lesdites proteines modifiees, par 
exemple enrichies en lysine, ainsi que des anticorps diriges contre ces 
prot6ines. 

Un oligonucleotide approprie pour la realisation de I'invention, 
5 utilisable pour la preparation de sequences de nucleotides recombinantes, 
est caracterise en ce qu'il comprend au moins un enchancement codant 
pour un polypeptide repondant a la formule (P-K) n , dans laquelle : 

- n est un entier superieur ou egal a 2, 

- P represente un r6sidu decide amine Proline, 
10 - K represente un residu d'acide amine Lysine, 

- le signe "-" symbolise une liaison entre ies deux residus d'acides 
amines et notamment une liaison de type peptidique, Ies n unites (P~K) 
etant liees entre elles egalement par de telles liaisons par exemple de type 
peptidique. 

is Un oligonucleotide selon I'invention est done caracterise selon un 

premier mode de realisation, en ce qu'il comprend une sequence codant 
pour une suite de motifs r6p6t6s comportant deux acides amines. 

Les codons de ('oligonucleotide peuvent etre identiques pour tous 
Ies residus Proline et/ou pour tous les residus lysine. Us peuvent aussi §tre 
20 differents pour un meme residu d'acide amine, la variation tenant compte 
de la degenerescence du code genetique. 

De preference, cet oligonucleotide est forme par une sequence 
codant pour plus de 2 unites (P-K). De preference n est inferieur ou egal a 
30, en particulier inferieur a 20 et avantageusement n est egal a 4, 5, 6, 7, 
25 8, 9ou 10 ou 15. 

Les "oligonucleotides" selon I'invention peuvent etre synthases 
chimiquement par toute technique disponible. 

Le terme "polypeptide" par reference a I'enchainement (P-K) ft 
designe, dans le cadre de la presente demande, une sequence d'acides 
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amines comportant plus de 2 residus d'acides amines et pouvant 
comporter jusqu'a 60 residus d'acides amines. 

Selon une premiere variante de realisation de I'invention, 
I'oligonucleotide comprend plusieurs enchainements codant pour un 
5 polypeptide repondant a la formule (P-K) n , identiques ou differents, 
associes en tandem. 

Ces oligonucleotides sont soil des repetitions d'un meme 
enchainement, soit des associations d'enchainement differents. Le nombre 
d'enchainements associes est variable, pouvant par exemple etre compris 
10 entre 2 et 1 0 enchainements. 

Selon une autre variante de realisation de I'invention, 
I'oligonucleotide precedemment defini est caracterise en ce qu'il comprend 
au moins un enchainement codant pour un polypeptide repondant a la 
formule (P-K) n , dans laquelle la sequence des n unites (P-K) est 
is interrompue par un ou plusieurs residus d'acides amines differents des 
residus P ou K. 

De preference, les acides amines supplementaires incorpores dans 
la sequence formee par les unites (P-K) sont choisis pour ne pas modifier 
("organisation du polypeptide code par I'oligonucleotide, ou a tout le moins 
20 pour ne pas provoquer d'interaction avec des acides amines d'une proteine 
dans laquelle ledit polypeptide serait incorpore, dans des conditions qui 
affecteraient la structure et/ou la fonction et/ou la localisation de cette 
proteine. 

Ceci peut en particulier etre le cas lorsque le nombre d'unites (P-K) 
25 est important ou que plusieurs enchainements formes de sequences 
codant pour des motifs (P-K)„ sont associes en tandem et que la 
preparation de I'oligonucleotide correspondent necessite que soient 
synthetisees plusieurs sequences nucletotidiques qui sont ensuite 
associees par exemple au moyen de sequences de liaison (linkers). 
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Selon un autre mode de realisation de I'invention, ('oligonucleotide 
est tel que Tenchainement codant pour le polypeptide comprenant les n 
unites (P-K) est complete a son extremite 5' et/ou a son extremite 3\ par un 
ou plusieurs codons, codant par exemple pour au moins un residu lysine a 
5 I'extremite N-terminale du polypeptide. 

A titre d'exemple, un oligonucleotide prefere selon I'invention est 
caract6rise en ce qu'il code pour un polypeptide repondant a la formule (P- 
K), a la formule K-(P-K) 4 , ou a la formule 2K (P-K) 4 . 

Selon un mode de realisation particulier, la composition de cet 
10 oligonucleotide correspond & Tune des sequences decrites dans les pages 
qui suivent et identifies par les designations SEQ ID No:1 et SEQ ID 
No:2. 

Les oligonucleotides precedemment decrits constituent des moyens 
de base pour realiser des sequences de nucleotides recombinantes 
15 capables d'exprimer des proteines ou des polypeptides de reserve de 
plantes enrichis en lysine. 

(.'invention a done aussi pour objet une sequence de nucleotides 
recombinante comprenant un enchainement de nucleotides codant pour 
une proteine de reserve d'une plante, caracterisee en ce qu'elle comprend 
20 en outre un oligonucleotide selon ('invention, insere en un site de 
Tenchainement de nucleotides choisi de fa^on telle que : 

- Texpression de la sequence de nucleotides dans une cellule 
veg6tale determinee permet tfobtenir une proteine de reserve modifiee 
localisee de fapon identique ou similaire dans cette cellule a la proteine de 

25 reserve normaie qui serait exprimee dans la meme cellule, dans les 
memes conditions par Tenchainement de nucleotides normal codant 
correspondant, et/ou 

- la proteine de reserve modifiee codee par la sequence de 
nucleotides est reconnue immunologiquement par des anticorps produits 

30 contre la proteine de reserve normaie correspondante. 
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En particulier, les anticorps precites sont constitues par un serum 
polyclonal ou sont obtenus contre des epitopes de la proteine de reserve 
normale qui sont conserves dans la proteine de reserve modifiee. 

Les cellules vegetales auxquelles il est fait reference ci-dessus 
comprennent toute cellule vegetale, quelle que soit son origine tissulaire 
ou sa nature. En particulier on s'interesse dans le cadre de I'invention aux 
cellules des organes de reserve, mais aussi aux cellules de feuilles, tiges, 
tubercules ... 

Par ('expression "proteine de reserve" d'une plante, on entend dans 
le cadre de la presente demande une proteine synthetisee durant la 
maturation des semences et qui est utilisee pendant la phase de 
germination comme reserve principale de nutrition. 

De facon generate, il s'agit d'un polypeptide susceptible d'etre 
synthetise dans un tissu de reserve quelle qu'en soit la localisation dans la 
plante ; les proteines de reserve mises en oeuvre dans le cadre de la 
presente demande sont en particulier celles produites dans les graines ou 
les semences des plantes de la famille des cereales, des cruciferes ou des 
legumineuses, et sont par exemple les prolamines, les zeines. 

Le choix du/des site(s) d'insertion de I'oligonucleotide dans 
I'enchainement codant pour la proteine de reserve de plante est determine 
par le respect des conditions ci-dessus enoncees. Selon le cas. I'insertion 
peut avoir lieu dans un domaine repetitif (en termes de sequence d'acides 
amines) de la proteine ou au niveau d'une extremite C- ou N-terminale. 

La condition donnee ci-dessus selon laquelle I'expression de la 
sequence de nucleotides recombinante de Tinvention dans une cellule 
vegetale permet d'obtenir une proteine de reserve modifiee, localisee 
identiquement ou similairement a la proteine de reserve normale qui serait 
exprimee dans les memes conditions dans la meme cellule vegetale, 
comporte par exemple pour les y-zeines synthetisees, la possibility d'etre 
accumulees dans le reticulum endoplasmique des cellules vegetales qui 
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10 

I'expriment, et en particulier dans les corps proteiques formes a partir de 
ce reticulum endoplasmique, lorsque la proteine est exprimee dans les 
cellules de I'endosperme. 

Pour obtenir ce resultat au moyen des sequences de nucleotides 

5 recombinantes de Finvention, des systemes d'expression adaptes a I'hote 
cellulaire dans lequel est exprimee la sequence de nucleotides 
s^lectionnee, et notamment les elements de regulation, par exemple les 
promoteurs, sont choisis pour leur caractere fonctionnel dans le tissu 
contenant les cellules transformees. Des tests pour effectuer ce choix 

10 peuvent etre realises en s'appuyant sur les differentes constructions 
decrites dans les exemples. 

Pour verifier que les proprietes immunologiques de la proteine de 
reserve modiftee exprimee par la sequence de nucleotides de r invention 
n'ont pas ete modifiees de fa?on consequente, on a utilise par exemple 

15 des antiserums tels que I'antiserum <xG2, decrit precisement dans la partie 
experimental qui suit. 

Selon un premier mode de realisation de I'invention, la sequence de 
nucleotides recombinante est caracterisee en ce qu'elle est obtenue a 
partir d'un enchainement codant de nucleotides qui conduit a I'expression 

20 d'une proteine de reserve naturellement pauvre en lysine. 

De fagon generale, cette sequence de nucleotides recombinante 
code pour une proteine de reserve modifiee derivee d'une proteine de 
reserve naturellement produite par une plante utilisable en alimentation 
animale ou humaine. 

25 Ainsi, les proteines de reserve dont on modifie la teneur en lysine 

dans le cadre de la presente invention sont avantageusement des 
proteines de reserve de plantes de la famille des cereales, des 
legumineuses ou des cruciferes. Des proteines de reserve particulierement 
importantes sont celles du maTs, en particulier les zeines, et plus 
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II 

specialement la y-zeine du mais, dont on cherche a augmenter la teneur 
en lysine. 

Une sequence de nucleotides recombinante particuliere selon 
I'invention est caracterisee en ce que I'enchainement codant de 
5 nucleotides codant pour la y-zeine de mais qu'elle contient, repond a la 
sequence presentee sur la Figure 9. 

D'autres sequences de nucleotides recombinantes de I'invention 
sont caracterisees en ce que I'enchainement codant de nucleotides 
qu'elles comprennent, code pour une proteine de reserve d'une plante 
o choisie parmi les suivantes : le soja, le tournesol, le tabac, le ble, I'avoine, 
la luzerne, le riz, le colza, le sorgo, Arabidopsis 

Selon un mode de realisation prefere de I'invention, dans la 
sequence de nucleotides recombinante comprenant un enchainement 
codant pour la y-zeine de mais, I'oligonucleotide de I'invention est insere a 
> la place de I'enchainement codant pour le domaine Pro-X naturellement 
present dans la sequence d'acides amines de la y-zeine du mais ou a la 
suite de cet enchainement. Le domaine Pro-X de la sequence d'acides 
amines de la y-zeine du mais est constitue par les acides amines situes 
entre les positions 70 et 91 de la sequence d'acides amines representee a 
' la Figure 9, correspondant aux nucleotides 265 a 330 de la sequence 
representee a la Figure 9. 

De facon preferee, dans la sequence de nucleotides de I'invention, 
I'oligonucleotide a la place ou a la suite du domaine Pro-X present entre 
les nucleotides 276 et 357 de la sequence representee a la Figure 9. 

Selon un autre mode de realisation de I'invention, dans la sequence 
de nucleotides recombinante comprenant un enchainement codant pour la 
y-zeine de mais. I'oligonucleotide de I'invention est insere a la suite du 
domaine Pro-X conserve dans la sequence de la y-zeine du mais. 
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Selon une autre variante de realisation, dans la sequence de 
nucleotides recombinante comprenant un enchainement codant pour la y- 
zeine de mai's, 1'oligonucleotide de I'invention est insere dans le domaine 
Pro-X maintenu dans la sequence de la y-zeine. 

5 Les insertions dont il est question ci-dessus sont realisables par les 

techniques disponibles, par exemple par recombinaison des sequences 
ayant subi une ou plusieurs etapes de digestion enzymatique. 

Dans un mode de realisation particulier de ('invention, une proline 
de reserve choisie enrichie en un acide amine determine est exprimee 

io dans des cellules vegetales heterologues. En d'autres termes une proteine 
de reserve presente naturellement dans une plante donnee, est exprimee 
sous forme enrichie en acides amines, dans une autre plante, ou dans une 
autre cellule que celle qui la produit naturellement. 

Outre I'enchainement codant pour une proteine de reserve de plante 

is et ^oligonucleotide de I'invention, les sequences de nucleotides 
recombinantes de I'invention peuvent egalement comprendre un promoteur 
^expression et, par exemple, un promoteur choisi pour son caractere 
specifique pour Texpression dans certaines parties ou dans certains tissus 
des plantes, ou au contraire un promoteur choisi pour son caractere 

20 constitutif. A titre d'exemple, lorsqu'ils sont specifiques, les promoteurs 
peuvent etre specifiques des semences et/ou d'organes ou de tissus 
determines de plantes. lis peuvent alternativement ou egalement etre 
specifiques d'une phase de croissance, par exemple d'un stade determine 
de la germination. 

25 A Tinverse ('utilisation de promoteurs constitutifs permet I'expression 

constante et generale de la proteine de reserve, entrainant une 
competition entre Texpression de la proteine de reserve native lorsqu'elle 
est presente et la proteine de reserve modifiee. 

A titre d'exemple, des promoteurs avantageux pour la realisation de 

30 Tinvention sont le promoteur de la y-zeine du mais contenu dans la 
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15 



20 



25 



sequence de 1,7 kb se trouvant en amont de la sequence codante 
representee a la Figure 7. le promoteur du virus de la mosaique du chou- 
fleur, a savoir le promoteur CaMV35S (EP-B-0131623), le promoteur 
constitutif du gene d'actine 1 de riz (PCT/US 9100073) ou le promoteur 
semence specifique "High Molecular weight gluthenine" du ble (Colot V. et 
al, 1987, EMBO Journal, vol. 6, p. 3559-3564). 

Le cas echeant, ces promoteurs sont completes par d'autres 
sequences de regulation, et en particulier des activateurs d'expression. 

A titre d'exemple, d'autres promoteurs utilisables pour la realisation 
de Tinvention sont par exemple le promoteur du gene codant pour la 
proteine de reserve 2S des semences d' Arabidoosis thaiiana ou encore 
les promoteurs de la lectine de haricot ou de la p-phaseoline de haricot. 

L'introduction supplemental d'activateurs de I'expression dans les 
sequences de regulation des sequences de nucleotides selon I'invention 
permet egalement d'augmenter le niveau de la transcription primaire de la 
sequence de nucleotides et, le cas echeant, d'augmenter la quantite de 
proteines de reserves modifiees produites. Des activateurs sont par 
exemple des introns de monocotyledones tels que I'intron 1 du gene 
d'actine de riz. 

L'invention a egalement pour objet un vecteur de clonage et/ou 
d'expression, caracterise en ce qu'il comprend, en un site non essentiel 
pour sa replication, une sequence de nucleotides repondant a I'une des 
definitions precedemment donnees. Des vecteurs particuliers interessants 
dans le cadre de la realisation de I'invention sont par exemple les 
plasmides P P20yZ, P H30yZ ou P H45yZ. Le plasmide pP20yZ a ete depose 
a la CNCM (Paris, FRANCE) le 31 Octobre 1995 sous le numero 1-1640. 
Le plasmide pH45yZ a ete depose a la CNCM le 31 Octobre 1995 sous le 
numero 1-1639. 
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Entre egalement dans le cadre de ['invention un polypeptide tel 
qu'exprime par une sequence de nucleotides recombinante repondant aux 
definitions precedentes. 

^expression ''polypeptide" n'introduit pas dans le cadre de la 
5 presente invention de limitation particuliere quant au nombre d'acides 
amines formant le polypeptide. II peut done s'agir de sequences 
comportant quelques acides amines, habituellement designees par 
Pexpression "peptides", ou encore de sequences beaucoup plus longues 
telles que cedes des proteines. 
10 ^invention concerne a cet egard la y-zeine de mais modifiee riche 

en lysine, caract6risee en ce qu'elle est cod6e par une sequence de 
nucleotides recombinante decrite precedemment. 

Selon un mode de realisation prefere de Tinvention, la y-zeine de 
mais modifiee enrichie en lysine est caracteris6e en ce que sa sequence 
15 d'acides amines est modifiee par au moins un polypeptide repondant a la 
formule (P-K) n , dans laquelle : 

- n est un entier sup^rieur ou 6gal a 2, 

- P represente un residu d'acide amine Proline, 

- K represente un residu d'acide amine Lysine, 

20 - le signe "-" symbolise une liaison entre les deux residus d'acides 

amines et notamment une liaison de type peptidique, les n unites (P-K) 
6tant Ii6es par des liaisons notamment de type peptidique. 

Selon une variante de realisation de invention le polypeptide 
integre dans la sequence d'acides amines de la y-zeine repond a la 

25 formule K-(P-K) n . 

Les polypeptides de Tinvention repondant a Tune des formules (P- 
K) n , K-(P-K) n ou a des variantes sont substitues a une sequence 
naturellement presente dans la y-zeine de mais normale ou insures avec 
deletion d'un ou plusieurs acides amines de la sequence d'acides amines 
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de ia y-zeine de maTs normale, ou ajoutes dans la sequence d'acides 
amines de la y-zeine normale, le site d'insertion du polypeptide etant choisi 
de fa?on telle que : 

- lorsque la y-zeine modifiee riche en lysine est produite dans une 
5 cellule hote, notamment une cellule vegetale, elle est localisee de fagon 

identique ou similaire dans cette cellule a la y-zeine de mais normale qui 
serait produite dans les m§mes conditions, dans la meme cellule h6te 
et/ou, 

- la y-zeine de mais modifiee est reconnue par des anticorps diriges 
10 contre la y-zeine normale de maTs. 

Les proteines P20yZ repr6sentee a la figure 1 1 ou H30yZ ou H45yZ 
representee a la figure 10, sont des exemples prSferes de la realisation de 
Tinvention et represented des y-z6ines de mais modifiees enrichies en 
lysine. 

15 L'invention a egalement pour objet une cellule hote recombinante, 

caracterisee en ce qu'elle comprend une sequence de nucleotides decrite 
ci-dessus 

Des cellules h6tes interessantes sont par exemple les cellules de 
bacteries, telles que celles de E. coli ou d' Aqrobacteirum tumefaciens . De 
20 preference, dans le cadre de ('invention, et pour I'expression stable de la 
proteine de reserve modifiee recherch§e, on aura recours a des cellules 
hdtes d'origine vegetale. 

A titre tfexemple, ces cellules d'origine vegetale sont des cellules 
de semences, de plante, et par exemple, a titre prefer^, des cellules 
25 d'endosperme de semences de mais. 

La sequence de nucleotides de Tinvention est de preference 
introduce dans le genome de la cellule hote de fa?on stable et dans des 
conditions telles que la proteine de reserve exprimee enrichie en acides 
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amines et en particulier en lysine est localisee comme le serait la proteine 
correspondante normale dans la meme cellule h6te. 

Des techniques variees sont disponibles pour transformer les 
cellules h6tes. A titre d'exemple, et en vue de transformer de fa9on stable 
5 ou de fagon transitoire les cellules hotes, on utilisera les techniques 
d'electroporation, de bombardement de microprojectiles portant de I'ADN, 
via canon a particules, via culture d'explants avec Agrobacterium 
tumefaciens . par penetration de microfibres. 

Outre les cellules d'endosperme de semences de mais, des cellules 
10 de soja, de tournesol, de tabac, de ble, d'avoine, de luzerne, de riz, de 
colza, de sorgo ou d' Arabidopsis peuvent etre mises en oeuvre pour 
exprimer les sequences de nucleotides de invention. 

La presente demande concerne aussi les semences produisant un 
polypeptide tel que decrit ci-dessus et les plantes produisant ce meme 
15 polypeptide. De preference, ces plantes sont du mais. 

[/invention a aussi pour objet des semences obtenues a partir des 
plantes transformees exprimant le polypeptide de Tinvention, en d'autres 
termes le polypeptide de reserve modifie enrichi en acides amines 
determines. 

20 Selon un mode de realisation particulierement interessant de 

Tinvention, les proteines y-zeines modifiees enrichies en lysine, sont 
exprimees chez des mutants opaque 2 de mats. Ces mutants o2 decrits 
par Emerson R.A. et al. (1935, Cornell Univ. Agric. Exp. Stn. Mem. 180) et 
caracterises par Mertz ET. et al (1964, Science 145 : 279-280) voient leur 

25 contenu en lysine fortement augmente ameliorant ainsi fortement les 
qualites nutritives du mats (compensation de son bas niveau en cet acide 
amine essentiel). Les mais classiques ont un contenu en lysine d'environ 
0,24% du produit brut (poids du grain total), les mais opaque 2 avoisinent 
en revanche 0,5% en lysine. Cependant its pr6sentent des caracteristiques 

30 agronomiques insuffisantes car leur endosperme est beaucoup moins 
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vitreux et se revele tres friable (phenotype "starchy"). Ceci a pour effet de 
les rendre extremement sensibles aux organismes pathogenes et aux 
etapes de traitements post recolte. Ce phenotype est en fait du a la 
diminution importante de certaines proteines de reserve en particulier les 
5 alpha zeines. En fait Qpaaue 2 code pour un facteur de transcription 
necessaire a I'expression de certains genes zeines (Schmidt R. J. et al, 
1990, Proc. Natl. Acad. Sci. USA 87, 46-50). 

Des derives opaque 2 n'ayant plus les inconvenients precites ont 
ete developpes par amelioration genetique classique, il s'agit des maTs 
10 QPM (Quality Protein Maize). L'analyse genetique recente de ces mais 
(Lopes M.A. et al, 1995, Theor. Appl. Genet. 19, 274-281) a montre que 
seulement 2 ou 3 loci se revelent clefs dans ces modifications favorables. 
Des analyses genetiques et biochimiques plus poussees permettent de 
postuler qu'un des 3 loci responsables est le locus y-zeine : les genotypes 
15 de maTs qui portent une duplication de ce gene situe dans la region 
centrometrique du chromosome 7, s'averent tous etre des modificateurs 
d'opaque 2 (Lopes M.A. et al, 1995, Mol. Gen. Genet. 19 : 247 : 603-613). 

La presente invention permet de preparer des mais mutants opaque 
2 a partir de mais n'ayant qu'un gene de y-zeine au niveau du chromosome 
20 7, qui sont complementes par I'addition d'une sequence recombinante 
codant pour une y-zeine de mais enrichie en lysine. Outre le fait d'acquerir 
les proprietes de durete similaire a un mais opaque 2 non mutant, il a 
I'avantage d'augmenter significativement la teneur en lysine, depassant 
ainsi cede des mais QPM. 
25 La presente invention permet d'obtenir des mutants opaque 2 de 

mais modifies, dans lesquels on a insere une sequence de nucleotides 
recombinante codant pour une y-zeine de mais enrichie en lysine. 



WO 97/28247 



PCT/FR97/00167 



L'invention a aussi pour objet un procede pour I'obtention de plantes 
ou de semences exprimant une proteine de reserve modifiee, caracteris§ 
en ce qu'il comprend les 6tapes de : 

a) transformation d'une cellule vegetate, avec une sequence de 
5 nucleotides ou un vecteur ci-dessus decrits, dans des conditions 

permettant Pexpression de fagon stable et fonctionnelle de la proteine de 
reserve modifiee codee par la sequence de nucleotides; 

b) regeneration de plantes a partir de la cellule de plante 
transformee de I'etape a), pour obtenir des plantes exprimant la proteine 

10 de r6serve modifi6e, 

c) le cas echeant, obtention des semences a partir des plantes 
modifiees obtenues a l'6tape b). 

Selon un mode de realisation avantageux de l'invention, la plante 
transformee est le mais et la proteine de reserve modifiee enrichie est la y- 
15 zeine, enrichie en lysine. 

L'invention concerne aussi les plantes obtenues par mise en oeuvre 
d'un tel procedd. 

Afin d'evaluer la teneur en un acide amine donne des plantes selon 
Tinvention, il est possible d'utiliser un protocole de dosage tel que celui 
20 mentionne dans Zarkadas et al, 1995, J. Agri. Food. Chem. Vol. 43: pages 
84-93. 

D'autres caracteristiques et avantages de Tinvention apparaissent 
dans les exemples et dans les figures qui suivent. 

25 Figure 1 

- Carte de restriction du plasmide pP20yZ 

Figure 2 

- Carte de restriction du plasmide pH45yZ 
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Figure 3 

- Representation schematique des proteines codees par les genes 
modifies et non modifies de la y-zeine : y-zeine de type sauvage (yZ), y- 
5 zeines riches en lysine (P20yZ, H30yZ. H45y2 et N13yZ) resultant de 
I'insertion des oligonucleotides codant pour des sequences riches en 
lysine. La sequence d'acides amines des polypeptides inseres est indiquee 
en utilisant ie code a une lettre de la representation des acides amines. 
Les abreviations suivantes sont utilisees : 
10 Term : terminal ; 

ProX DOMAIN : domaine linker proline-Xaa. 

F 'fl ure 4 " Analyse in-vitro des y-zeines riches en lysine. (A) traduction irv 
vitro et translocation des transcrits correspondent aux y-zeines modifiees 

15 riches en lysine ; lignes 1. 5, 9 et 13 : produits complets de traduction ; 
lignes 2, 6, 10 et 14 : produits complets de traduction apres translocation 
dans les microsomes canins (CM); lignes 3. 7, 11 et 15: produits de 
translocation resistant a Taction de la proteinase K (PK) ; lignes 4, 8, 12 et 
16 : totalite des produits de traduction apres traitement avec la proteinase 

20 K en presence de 0,5% Nonidet P40(NP40). (B) Immunoprecipitation des 
produits de traduction in-vitro correspondent aux proteines y-zeine et y- 
zeine modifiees riches en lysine, en utilisant I'anti-serum aPL. Ligne 1 : y- 
zeine ; ligne 2 : P20yZ ; ligne 3 : H30yZ ; ligne 4 : H45yZ et iigne 5 : N13yZ. 
(C) Meme legende que pour (B) mais en utilisant I'antiserum aG2. Les 

25 marqueurs de poids moleculaire (en kilodaltons) sont indiques sur la 
gauche. 



F| q ure 5 - Activite tissu-specifique du promoteur de la y-zeine. Des 
endospermes de mais, des embryons et des feuilles de mais ont ete co- 
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transformes par bombardement de particules en utilisant les constructions 
representees dans la figure (dans la partie a droite). Les activites relatives 
de la luciferase (LUC, colonnes en gris) et de la ^-glucuronidase (GUS, 
colonnes hachurees) ont ete exprimees sous la forme d'un multiplicateur 
5 des valeurs obtenues avec des projectiles nus + la deviation standard des 
differents ratios. 

Figure 6 - Expression des y-zeines riches en lysine dans Tendosperme 
sub-aleuronique des cellules. (A) Immunoblot avec un antiserum aPL, de 

io proteines extraites d'endospermes transformes par pN13yZ (ligne 2), 
pH45yZ (ligne 3), pH30yZ (ligne 4) et pP20yZ (ligne 5). Le temoin (ligne 1) 
correspond a des endospermes non transformes. Les marqueurs de poids 
moteculaire (en kilodaltons) sont indiqu£s a gauche. (B) expression des 
transcrits H45yZ et N13yZ dans des endospermes transformes de fa$on 

15 transitoire. Les cDNAs obtenus a partir des tissus transformes avec 
pH45yZ (ligne 2), pN13yZ (ligne 3) et le temoin (ligne 1) ont ete amplifies 
par PCR et analyses en utilisant un oligonucleotide synth§tique codant 
pour une sequence riche en lysine a titre de sonde. 

20 Figure 7 - Accumulation de y-zeines riches en lysine dans les corps 
proteiques de I'endosperme. (A) Analyse en immunoblot en utilisant 
I'antiserum aPL, des corps proteiques isoles a partir des endospermes 
transformes avec pP20yZ (ligne 1), pH30yZ (ligne 2), pH45yZ (ligne 3), 
pN13yZ (ligne 4) et aucun ADN (ligne 5). (B) Analyse en immunoblot en 

25 utilisant ('antiserum aPL, des corps proteiques isoles a partir des 
endospermes transformes avec pP20yZ, pH30yZ et pH45yZ et dig6res 
avec la proteinase K en presence d'un tampon isotonique (Sucr., lignes 1, 
3 et 5) ou un tampon hypotonique (H 2 0, lignes 2, 4 et 6). Les marqueurs 
de poids moleculaire (en kilodaltons) sont indiques sur la gauche. 
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Figure 8 - Co-localisation des proteines P20yZ avec les a- et les y-zeines 
dans les corps proteiques de I'endosperme du mais. Une analyse en 
immunocytochimie a ete realisee sur des sections ultrafines en utilisant 
5 des anticorps aPL (marques avec des particules d'or de diametre 15 nm) 
et des anticorps aZ et aG2 (marques avec des particules d'or de 5 nm). (A) 
Corps proteiques de I'endosperme transforme avec pP20yZ, 
immunomarques avec I'anticorps aPL (B) Immunolocalisation de P20yZ 
(marque avec des particules d'or de 15 nm) et de I'a-zeine (marquee avec 

10 les particules d'or de 5 nm) dans les corps proteiques isoles a partir des 
endospermes transformes avec pP20yZ. (C) et (D) Immunolocalisation de 
P20yZ (marque avec les particules d'or de 15 nm) et des y-zeines 
(marquees avec les particules d'or de 5 nm) dans des corps proteiques 
isoles a partir des endospermes transformes avec pP20yZ. Les fleches 

15 indiquent les sections tangentielles des corps proteiques. 

Fiflurej - Sequence codante de I'ADNc la y-zeine de mais et la sequence 
d'acides amines correspondante. 



Figure 10 - Sequence codante de I'ADNc de la H45yZ zeine de mais et la 
sequence d'acides amines correspondante. 

La sequence riche en lysine (28 acides amines) est introduite 
entre les residus d'acides amines 92 et 1 19 de la sequence representee a 
25 la Figure 10. 



R g ure11 - Sequence codante de I'ADNc de la P20yZ zeine de mais et la 
sequence d'acides amines correspondante. 
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La sequence riche en lysine (14 acides amines) est introduite 
entre les residus d'acides amines 92 et 1 1 9 de la sequence representee a 
la Figure 1 1 . 

5 Figure 12 - Cartes de restriction des plasmides pBin 19P20yZ et 
pBin19H30yZ. 

Figure 13 - Endospermes des plants de mais transgeniques accumulant 
de la y-zeine enrichie en lysine 
10 A et B: SDS-page et Immunoblot utilisant ^antiserum aPL 



A) 10 |jg de prot6ine par piste (transformants avec le construit H45yZ) 
piste C: extrait proteique des endospermes d'hybrides B73xA188 (controle) 
piste 1 : A1 

15 piste 2: B1 
piste 3: B2 
piste 4: C1 
piste 5: D1 
piste 6: D2 

20 

B) 1 pg de proteine par piste (transformants avec le construit P20yZ) 
piste C: controle 

piste 1 : A1 
piste 2: A2 
25 piste 3: B1 
piste 4: C1 
piste 5: D1 
piste 6: E1 



WO 97/28247 



PCT/FR97/00167 



15 



C) SDS-page et coloration a I'argent (3 transformants P20yZ et 3 
transformants H45yZ) 
piste 1 : A2 
piste 2: B1 



piste 9: D2 

Figure 14 - Contenu en y-zeine enrichie en lysine par grain (transformants 
45yZB1 et C1) 

A: coloration a I'argent; 1 0 pg de proteine par piste 

B: immunoblot utilisant I'antiserum aPL; 1 pg de proteine par piste 

Pistes 1 a 5: extraits proteiques de differents endospermes du transformant 

45yZBl. 

Pistes 6 a 10: extraits proteiques de differents endospermes du 
transformant 45yZ C1 . 

Figure 15 : 

A) Contenu en y-zeine enrichie en lysine de 10 grains (transformant 45yZ 
C1) utilisant I'antiserum aPL 1 jjg de proteine par piste 



piste 3: C1 
piste 4: B1 
piste 5: A1 
piste 6: D2 



10 pg de proteine par piste 



piste 7: B1 
piste 8: A1 



40 \jg de proteine par piste 



Pistes 1 a 10: extrait d^ndospermes de 10 descendants 

20 
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B) Immunoblot des extraits proteiques des endospermes 1 a 5 presents en 
A) et marques avec Tantiserum otG2; 2 jjg de proteine par piste. 

EXEMPLES 

5 

A) Preparation de v-z6ines modiftees enrichies en lysine et 
expression de ces prolines modiftees suivie de I'accumulation dans 
les corps proteiques des cellules de I'endosperme de mais 

io La Y-zeine est une proteine de reserve du mais, ayant un poids 

mol6culaire de 28 kD, riche en soufre, qui est accumulee dans les cellules 
de Tendosperme avec les a-et (i-zeines, dans les corps proteiques derives 
du reticulum endoplasmique granulaire (ER) (Ludevid et al., 1984, Plant 
Mol. Biol. 3, 227-234 ; Lending et al., 1984, Plant Cell 1, 1011-1023). La 

15 sequence d'acides amines d§duite de la sequence nucleotidique de PADNc 
(Prat et al., 1985, Nucl. Acids Res. 13, 1493-1504) et des clones 
g6nomiques (Boronat et al., 1986, Plant Sci. 47, 95-102) montre que la y- 
zeine n'a pas d'homologie avec les polypeptides de type a-zeine. Bien que 
la Y-zeine soit codee par 1 a 2 genes par genome haploide (Boronat et al., 

20 1986, Plant Sci. 47, 95-102) elle represente 10-15% de la totalite des 
proteines des endospermes de mais. L'expression du gene de la Y-z6ine 
dans des systemes heterologues tels que les oocytes de Xenopus (Torrent 
et al., 1994, Planta 192, 512-518) et dans Arabidopsis thaliana (Geli et al, 
1994, Plant Cell 6, 1911-1922), indique que les polypeptides de Y-zeine 

25 restent stables et sont capables en tant que tels de former des corps 
proteiques derives du reticulum endoplasmique, £ I'interieur des cellules. 
De plus, des analyses par deletion de differents domaines structuraux de 
la Y-zeine ont montre que la sequence N-terminale incluant le domaine 
rep6te riche en proline, etait responsable de la retention de la Y-zeine dans 



WO 97/28247 



PCT/FR97/00167 



25 

le reticulum endoplasmique et que le domaine C-terminal riche en cysteine 
etait responsable de la formation des corps proteiques. Le domaine Pro-X 
ne semblait pas en relation avec la stabilite de la proteine ni avec sa 
localisation ciblee (Geli et al M 1994, Plant Cell 6, 1911-1922). 
5 Materiel et Methodes 



Materiel vegetal 



Apres une sterilisation en surface (1) des graines de stade 17 DAP 
10 ("days after pollination") du mais de selection W64A ont ete dissequees a 
la main et la couche de pericarpe et d'aleurone a ete separee des 
endospermes. Des sections tangentielles ont ete realisees de facon a 
exposer une grande partie de la surface sub-aleuronique. Si necessaire, 
des embryons ont ete isoles et des feuilles de plantes agees de 7 jours ont 
15 ete dissequees pour retirer le tissu epidermique. Apres dissection, les 
echantillons ont ete deposes dans des boites de Petri sur des papiers 
filtres humidifies avec un milieu MS (Murashige et Skoog, 1962, Physiol. 
Plant. 15, 473-497). 



20 Constructions plasmidlques 



Un premier ensemble de plasmides, pKSG2, pHbP2, pPbP4 et 
pNaN1 a ete obtenu pour permettre I'introduction de sites de restriction 
dans le gene codant pour la y-zeine. pKSG2 et pHbP2 ont ete construits 
selon la description decrite dans la publication de Torrent M. et al. (Planta 
(1994) 192 : 512-518). Le plasmide pKSG2 contient la sequence codante 
de la y-zeine. 
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Le plasmide pHbP2 est obtenu a partir de pKSG2 et contient une 
sequence codant pour une y-zeine mutee dans laquelle le domaine Pro-X 
de la proteine a ete delete. 

Le plasmide pPbP4 a ete obtenu a la suite de deux etapes de 
5 clonage : (t) le fragment de restriction Sall-Pvull de 350 pb de pKSG2 a 6t6 
clon§ dans un plasmide Bluescript (pBSKS, Stratagene, La Jotla, California 
USA) restreint avec Sail et EcoRV (pKSC4) et (ii) le fragment de restriction 
Pvull-Xbal de 600 bp de pKSG2 a ete clone dans les sites de restriction 
Smal-Xbal de pKSC4. La nouvelle construction pPbP4 contient un site de 
10 restriction utile EcoRI juste avant le domaine P-X de la sequence codante 
de la Y-zeine. 

Le plasmide pNaN1 a egalement ete obtenu a I'aide de deux etapes 
de clonage : (i) le fragment Nael-Xbal de 250 bp de pKSG2 a ete clone 
dans le plasmide pBSKS restreint avec EcoRV-Xbal (pKSC8) et (ii) le 
15 fragment de restriction Nael-Hindlll de 700 bp (a extremites franches) de 
pKSG2 a ete clone dans le site de restriction Hindlll de pKSC8. La 
nouvelle construction, pNaN1, contient des sites de restriction Clal et 
Hindlll a une position situee a 15 nucleotides avant le codon stop de la y- 
zeine. 

20 Deux oligonucleotides synthetiques repondant aux sequences 

suivantes : SEQ ID N°1 : 

5 , CGATGAATTCAAACCAAAGCCAAAGCCGAAGCCAAAAGAATTCA3 , > et 
sa sequence inverse appelee SEQ ID N°2, dont la sequence est la 
suivante : 

25 57\GCTTGAATTCTTTTGGCTTCGGC^ 

codant pour des sequences riches en lysine designees K(P-K) 4 , ont ete 
hybrid6es, digerees avec EcoRI et donees dans un site EcoRI de pHbP2 
et pPbP4. Trois clones ont ete selectionnes : pPo2 et pHo3 contenant la 
sequence codante pour K(P-K) 4 et pHo4 comprenant la forme tronquee de 
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la sequence codant pour le y-zeine contenant un tandem 2K(P-K) 4 (sous 
forme d'une sequence K (P-K) 4 EF K(P-K)« ) de la sequence codante rlche 
en lysine. Les memes oligonucleotides hybrides ont ete digeres avec des 
enzymes Clal-Hindlll et clones dans le plasmide pNaN1 restreint a I'aide 
des memes enzymes. Le clone selectionne, pNol, contenait la sequence 
codant pour la sequence riche en lysine K(P-K)< a I'extremite N-terminale 
de la y-zeine modifiee correspondante. 

Pour la transformation transitoire de I'endosperme, les sequences 
codant pour la y-zeine modifiee de pPo2 et pHo3 ont ete inserees sous la 
forme de fragments Hincll-Nhel dans des sites Smal-Xbal de pDH51 
(Pietrzah et al.. 1986, Nucl. Acid Res. 14, 5857-5868) contenant le 
promoteur 35S du virus de la Mosaique du chou-fleur (CaMV). Le 
promoteur pP20yZ obtenu par I'insertion decrite ci-dessus des fragments 
Hincll-Nhel dans les plasmide pDH51 contient la sequence codante de la 
y-zeine enrichie en lysine (Figure 8) ainsi que les signaux de la sequence 
35S du virus CaMV pour la formation de I'extremite 3' et la polyadenilation. 
La sequence codante chimere P20yZ a ete construite a partir de la region 
codante de la y-zeine contenu dans le plasmide pKSG2 apres differentes 
etapes de clonage. Le promoteur de 1,7 kb de la y-zeine (Reina et al. 
1990, Nucl. Acids Res. 18, 6426) a ete insere dans les extremites franches 
d'un fragment Hindll-Pvul dans pHo4 et P No1 restreints avec Xho1 et 
obtenus avec des extremites franches. Les constructions pH45yZ et 
pN13yZ ont respectivement ete obtenues. 

Les nouvelles constructions, respectivement appelees pP20y-Z, 
pH30yZ, P H45yZ et P N13yZ ont ete utilisees dans des experiences de 
bombardement biolistique. 

Pour etudier la specificite de differents promoteurs vis-a-vis des 
tissus vegetaux, deux constructions, p1.7yZGUS et pCaMV35SLUC ont ete 
utilisees. p1.7yZGUS a ete obtenue par insertion du promoteur de la y- 
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zeine de 1,7 kb (Hindlll-Pvul) dans un plasmide derive de pPuC18 
contenant le gene GUS et les signaux NOS de polyadenilation en 3' de pBI 
101.1 (Jefferson et al., 1987, Embo. J. 6, 3901-3907). pCaMV35SLUC a 
6te obtenu par insertion du gene codant pour la luciferase (LUC) de 
5 pAHC18 (Bruce et at., 1989, P. H. 86, 9692-9696) dans le polylinker de 
pDH51 (Pietrzak et al., 1986, Nucl. Acids Res. 18, 6426). 

Analyse in-vitro 

10 Les plasmides derives de pBSKS contenant les sequences 

codantes de la y-zeine (pKSG2) et de la y-zeine riche en lysine (pPo2, 
pHo3, pHo4 et pNol) ont ete transcrits in-vitro suivant les protocoles 
standards (Sambrook et al., 1989, Molecular Cloning: A laboratory manual, 
2nd, ed., Cold Spring Harbor Laboratory Ed., Cold Spring Harbor, New 

is York). Une traduction in-vitro et une translocation des transcrits 
synthetiques ont ete r6alis6es selon la technique de Torrent et aL, (1994, 
Panta 192, 512-518), a I'exception des microsomes canins (CM) utilises 
qui provenaient de Promega (Madison, Wis., USA). Uimmunoprecipitation 
des produits traduits a ete effectuee essentiellement selon la methode de 

20 Borgese et Gaetani (1980) en utilisant un serum de lapin anti-y-zeinea-G2, 
(Ludevid et al., 1985, Plant Sci. 41, 41-48) et un antiserum aPL. aPL est 
un antiserum polyclonal de lapin obtenu contre le peptide synth&tique 
EFK(P-K) e EF. Ce peptide a 6t6 synthetase en utilisant la technique de 
synthese en phase solide decrite par Celma et al., 1992. 

25 

Bombardement de microprojectile 

L'ADN plasmidique a ete absorbe sur des particules d'or (1,0 pm, 
Bio-Rad, Lab., Richmond, CA, USA) selon un protocole decrit par Kikkert 
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(Plant Cell, 33:221-226, 1993). Toutes les cibles ont ete bombardees deux 
fois, en utilisant le dispositif BioRad Biolistic PDS-1000/He. Les cibles ont 
ete positionnees 8 cm derriere un ecran stoppant les macroporteurs, qui 
etaient positionnes 1 cm au dessous du disque de rupture 900 PSI. Apres 
5 le bombardement, les echantillons ont ete incubes pendant 24 heures a 
26°C dans le noir. Des temoins etaient constitues par les cibles 
bombardees avec des microprojectiles depourvus d'ADN. 

Tests enzymatiques 

10 

Les tissus bombardes avec les plasmides pUyZGUS et 
pCaMV35SLUC ont ete homogeneises sur de la glace dans un tampon 
contenant 25mM Tris, a pH 7,8, 2mM DTT, 10% de glycerol et 1% de 
Triton X-100. Apres centrifugation a 12.000xg pendant 5 minutes, les 

15 surnageants ont ete decantes et la proteine soluble totale dans les extraits 
a ete quantifiee en utilisant le test Bradford (Bio-Rad). L'activite GUS a ete 
testee par analyse fluorimetrique selon la description de Jefferson (1987) 
en utilisant la 4-methyl-ombelliferyl-lJ-D-glucuronide (MUG) en tant que 
substrat. L'activite LUC a ete determinee en utilisant le systeme de test 

20 Luciferase (Luciferase Assay System Kit) diffuse par Promega. selon les 
instructions du fabriquant. 

Extraction des proteines de reserve et analyse sur gel des proteines 

25 Des endospermes transform^ avec pP20yZ, pH20yZ, pH45yZ et 

pN13yZ ont ete reduits a I'etat de farine et les a-zeines ont ete extraites a 
I'aide de trois series de solvants contenant 70% d'ethanol. La farine 
residuelle a ete sechee a I'air, et les proteines totales ont ete extraites 
avec un tampon contenant 0,25 M Tris-HCI, pH 6.8, 4% sodium dodecyl 



WO 97/28247 



PCT/FR97/00167 



30 

sulfate (SDS) et 5% 2-mercaptoethanol, pendant 1 heure a temperature 
ambiante. Les extraits de proteines ont ete analyses par SDS-PAGE et 
immunoblot selon la description de Ludevid et al., 1985. Des feuilles de 
nitrocellulose ont ete intubees avec de I'antiserum aPL (dilution 1:500) et 
5 de la peroxidase de Raifort conjuguee avec un anticorps secondaire (ECL 
Western Blotting System, Amersham, Buckinghamshire, UK) a ete utilisee 
pour la detection de la proteine. 

Analyse de I'expression de TARN 

10 

L'ARN total a ete extrait selon la description de Logemas et al., 
1987. L'ADN compl6mentaire (ADNc) a et6 prepare en utilisant la 
transcriptase reverse et I'oligo dT de Gibco BRL (Gaithersburg, MD ( USA) 
selon les instructions du fabriquant et cet ARN a ete amplifie par une 

is reaction de PCR. Des oligonucleotides amorces utilisees pour la PCR 
etaient des sequences de 20-mers correspondant aux extr6mites de 5' et 3' 
du gene de structure de la y-zeine. Des protocoles standards ont 6te 
utilises pour la preparation de sondes marquees au 32 P, et pour Tanalyse 
sur gel de TADN (Sambrook et al. Molecular Cloning: A laboratory manual, 

20 2nd. ed. t Cold Spring Harbor Laboratory Ed., Cold Spring Harbor, New 
York) en utilisant un oligonucleotide synth6tique codant pour une 
sequence riche en lysine (voir ci-dessus) en tant que sonde. 

Isolernent des corps prot£iques et traitement par la protease 

25 

Ces protocoles ont ete decrits anterieurement (Torrent et al., Planta, 
180: 90-95, 1989). 

Microscopie 6lectronique 
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Les corps proteiques des endospermes de type sauvage et des 
endospermes transformes par pP20y2 ont ete fixes avec 2,5% de 
paraformaldehyde dans 20 mM de tampon phosphate a pH7,2, pendant 1 

5 heure a temperature ambiante, et transformes selon la description de Geli 
et al., 1994, Plant Cell 6, 1911-1922) toutefois en utilisant un antiserum ot- 
PL et un colloide d'or et de proteine A ayant un diametre de 15 nm. Pour le 
marquage double, des sections ultra fines ont ete d'abord incubees avec 
a-PL et le colloide d'or et de proteine A (15 nm de diametre) a ete utilise 

10 pour la detection de I'anticorps. Apres lavage, des sections ont ete 
incubees avec 0,15mg/mL de proteines A pendant 20 minutes pour 
saturer les immunoglobulines et finalement les grilles ont ete incubees 
avec des sera ct-G2 ou a-21 et le colloide or/proteine A (diametre 5 nm) a 
ete utilise pour la detection de I'anticorps. a-21 est un antiserum polyclonal 

15 de lapin dirige contre I'a-zeine obtenu selon la description de Ludevid et 
al., 1985, Plant Sci. 41, 41-48). 

Resultats 

20 Construction des v-zeines riches en lysine 

Les inventeurs avaient demontre I'importance du domaine repete 
riche en proline ("proline-rich repeat") et du domaine C-terminal riche en 
cysteine pour la retention dans le reticulum endoplasmique de la y-zeine et 
is la formation des corps proteiques contenant ces proteines dans les 
cellules de feuilles de Arabidopsis (Geli et al., 1994, Plant Cell 6, 1911- 
1922). Sur la base de ces resultats prealables, la possibility d'inserer des 
sequences riches en lysine dans differents domaines de la y-zeine, de 
facon a creer une y-zeine modifiee correctement ciblee et accumulee dans 



WO 97/28247 



PCT/FR97/00167 



r>2 

les cellules de I'endosperme a ete investiguee afin d'ameliorer les qualites 
nutritives du mais. 

Les inventeurs ont a present construit des genes modifies de la y- 
z6ine par introduction d'oligonucleotides synth6tiques codant pour des 

5 sequences riches en lysine dans differents sites de la sequence codante 
de la v-zeine. Des constructions de y-zeine modifiee ont 6te creees de 
fapon a Sviter le placement des sequences codantes riches en lysine dans 
les domaines constitu6s par le domaine repute en tandem et le domaine 
riche en cysteine. Des modifications de la sequence codante de la y-zeine 

10 ont 6t§ effectu6es dans la sequence correspondant au domaine Pro-X. De 
plus pour minimiser une alteration du repliement de la proteine, les 
sequences riches en lysine (P-K) n ont ete defintes pour imiter la sequence 
du domaine Pro-X. Comme on le voit sur la figure 3, dans la proteine 
P20yZ t une sequence K(P-K) 4 a ete introduite apres la region Pro-X et 

15 dans la proteine H30yZ et dans la proteine H45yZ, des sequences d'acides 
amines comprenant K(P-K) 4 et 2K(P-K) 4 respectivement remplacent le 
domaine Pro-X de la y-zeine (yZ, Fig. 3). Pour explorer si Textremite C- 
terminale etait un site permissif pour ('introduction des sequences riches 
en lysine, une proteine supplemental N13yZ, a ete creee par I'insertion 

20 d'une sequence contenant K(P-K) 4 cinq acides amines en amont de 
Pextremit6 C-terminale (Fig.3). 

Activite du promoteur de la v-zeine dans Tendosperme de mats transform6 

25 Pour determiner si des y-zeines riches en lysine pouvaient §tre 

exprimees dans les cellules de I'endosperme, on a tout d'abord recherch6 
un promoteur efficace et un systeme de transformation. Un promoteur de la 
y-zeine, contenant une sequence en amont de 1,7 Kb (Reina et al M 1990, 
Nucleic Acid Research, vol. 18, p. 6426) et le promoteur CaMV contenant 
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625 bp de la sequence en amont de la proteine 35S du virus de la 
mosaique du chou-fleur CaMV ont ete testes. Jusqu'a present aucune 
information n'etait disponible sur I'analyse fonctionnelle des fusions de 
genes avec le promoteur de la y-zeine dans les plantes monocotyledones 

5 transgeniques. Pour analyser I'activite et la specificite tissulaire du 
promoteur de la y-zeine, deux genes chimeres ont ete construits (voir 
Fig. 5). I'expression transitoire par bombardement biolistique (Klein et al., 
1988 PNAS 85:4305) a ete utilisee comme procedure de transformation du 
mais pour I'analyse du promoteur aussi bien que pour des experiences 

o depression des y-zeines riches en lysine. Des endospermes de mais de 
stade 17 DAP (17 jours apres la polynisation) (le pericarpe et les cellules 
de la couche aleuroniques etaient-enleves), des embryons (17 DAP) et des 
jeunes feuilles (Sgees de 10 jours) ont ete bombard6s avec des projectiles 
d'or recouverts avec de I'ADN plasmidique contenant les deux 

5 constructions. La figure 5 montre les activites de ^-glucuronidase (GUS) et 
de luciferase (LUC) presentes dans les trois tissus testes : I'endosperme, 
Tembryon et la feuille, par rapport a I'experience temoin. On doit noter que 
les resultats correspondent a la moyenne d'au moins 3 experiences 
independantes realisees. Toute I'activite GUS sous le contrdle du 

> promoteur de la y-zeine etait restreinte a I'endosperme, puisque aucune 
expression GUS n'a ete detectee dans I'embryon et dans les feuilles. De 
plus, les endospermes bombardes ont ete colores histochimiquement pour 
determiner le nombre de clusters cellulaires exprimant la proteine GUS. Le 
profil de coloration corroborait les resultats precedents, GUS etait 
fortement exprime dans les endospermes (le nombre moyen de clusters 
cellulaires colores pour GUS par endospermes etait de 150) et des taches 
bleues n'ont pas ete detectees dans I'embryon et dans les feuilles. Au 
contraire. le promoteur CaMV 35S conferait une activite LUC dans tous les 
tissus testes (Fig. 5), mais il existait cependant des differences 
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quantitatives entre I'activite relative de I'enzyme dans les feuilles et les 
embryons par rapport a Tendosperme. Ces differences pouvaient etre 
attribu6es a une variability intrinseque de I'activite constitutive du 
promoteur CaMV parmt les differents tissus du mais ou a une penetration 

5 faible des particules recouvertes par I'ADN dans les cellules mesophyles 
contenant un systeme vacuolaire important. II existe dans I'etat de la 
technique des preuves selon lesquelles le promoteur CaMV aurait 
habituellement une faible activite dans des cellules de plantes 
monocotytedones (Fromm et al., 1985, Proc. Natl. Acad. Sci. USA 82, 

io 5824-5828) ; cependant les inventeurs ont montre ici une forte activite du 
promoteur CaMV dans des cellules d'endospermes. Ceci a permis de 
conclure que I'activite du promoteur de la y-zeine et du promoteur CaMV 
35S etait tres forte dans les endospermes de mats et ainsi que les deux 
promoteurs pouvaient s'averer utiles pour controler 1'expression de la 

15 proteine dans ce tissu. 

Pour determiner si les proteines mutantes codees par les 
constructions etaient competentes avec la fonction de translocation 
membranaire, des experiences de transcription-traduction in-vitro ont et6 
effectuees en presence de microsomes pancreatiques de chien. Les 

20 transcrits synthetiques de chaque construction ont ete traduits et la 
translocation a travers les membranes de microsomes testee par 
recherche de la protection vis-a-vis de la digestion par la proteinase K. 
Ces resultats rapportes a la figure 4A indiquent que les poids moleculaires 
apparents des polypeptides synthetases in-vitro refletent les mutations 

25 introduces (Fig. 4A, lignes 1, 5, 9 et 13). En presence des microsomes et 
de la proteinase K, des peptides de faible poids moleculaire n'ont pas ete 
observes, indiquant que les chaines polypeptidiques completes des y- 
zeines modifiees etaient transportees a travers les membranes 
microsomales (Fig. 4A, lignes 3, 7, 11 et 15). En comparant le resultat de 

30 la translocation des quatre y-zeine modifiees, on a observe que la proteine 
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H45yZ (Fig. 4A, ligne 11), qui contenait I'insertion de 10 acides amines de 
type lysine, a subi une translocation inferieure aux autres proteines. II 
semble que les residus charges negativement pourraient interferer dans 
une certaine proportion, sur I'efficacite de la translocation. Uanticorps 
5 polyclonal aG2, dirige centre la y-zeine (Ludevid et al., 1985, Plant Sci. 41, 
41-48) ne pouvant etre utilise pour distinguer entre la y-zeine de type 
sauvage et les y-zeines modifiees, un anticorps aPL dirige contre un 
peptide synthetique contenant la sequence d'acides amines riche en lysine 
a 6t6 prepare. On a ensuite teste si des proteines modifiees synthetisees 

10 in-vitro etaient reconnues a la fois par les anticorps aG2 et les anticorps 
aPL Cette experience est illustree a la figure 4B et la figure 4C ou les 
transcrits synthetiques de la y-zeine, P20yZ, H30yZ, H45yZ et N13yZ 
etaient traduits in-vitro et dans lesquels les produits de traduction etaient 
immunoprecipites avec aPL (Fig. 4B) et avec aG2 (Fig. 4C). Ces resultats 

15 indiquent que les y-zeines riches en lysine etaient reconnues par les deux 
anticorps (voir Fig. 4B et C, lignes 2 a 5) et que la y-zeine etait seulement 
reconnue par le serum aG2 (Fig. 4B et C, ligne 1). Ainsi la specificite des 
anticorps aPL pour les proteines modifies a permis de distinguer la y- 
zeine riche en lysine de la y-zeine endogene lorsque les genes modifies 

20 6taient exprimes dans des cellules d'endosperme. Prises ensemble ces 
experiences ont montre que la presence de sequences riches en lysine ne 
perturbait pas la fonction de translocation a travers la membrane ou le 
comportement immunologique de la y-zeine. 

25 Analyse d e ['expression des v-zeines enrichies en lysine dans les 
endospermes de majs 

Pour explorer si la y-zeine modifiee riche en lysine §tait exprimee et 
accumulee dans les cellules de Tendosperme, des graines de stade 17 
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DAP ont ete bombardees avec I'ADN contenant les sequences codant pour 
la proteine des quatre constructions (Fig. 3) sous le controle du promoteur 
CaMV (P20yZ et H20yZ) et du promoteur de la y-zeine (H45yZ et N13yZ). 
Des constructions comprenant des promoteurs anti-sens ou depourvues de 
5 promoteurs ont ete utilisees comme temoins. Apres 24 heures de 
transformation des endospermes, les proteines totales ont ete extraites et 
Texpression des y-zeines modifiees a 6te testee par immunoblotting en 
utilisant I'anticorps aPL. La figure 6A montre que les genes chimeres de y- 
zeine contenant I'insertion (Pro-Lys) n apres le domaine Pro-X (P20yZ) ou le 

10 rempla^ant (H45yZ et H30yZ) etaient fortement exprimes et les produits de 
traduction accumules efficacement dans les cellules de I'endosperme 
(Fig. 6A, lignes 3, 4 et 5). Pour chaque ligne, les extraits de proteine 
correspondaient a 1/3 environ d'un endosperme bombarde, ce qui a permis 
d'estimer que la quantite de proteines modifiees P20yZ, H30yZ et H45yZ 

is par endosperme atteignait le niveau du nanogramme. De plus, aucune 
difference quantitative entre les niveaux ^expression des genes chimeres 
sous le controle du promoteur CaMV et du promoteur de la y-zeine n'a ete 
observ§e, confirmant les resultats ci-dessus d6crits obtenus avec les 
proteines marqueurs GUS et LUC (Fig. 5). On a note que Tanticorps aPL 

20 reconnaissait une proteine d'environ 30 kD presente dans les extraits de 
proteine totale, meme dans les endospermes non transformes (voir la 
bande faible presente dans les quatre lignes de la figure 6A). Une 
procedure d'extraction sequentielle de proteine a permis de constater que 
cette proteine n'etait pas une proteine de reserve soluble dans un milieu 

25 aqueux. 

Comme le montre la figure 6A (ligne 2) aucune trace de la proteine 
N13yZ n'a et6 d6tectee, indiquant que le gene chimere correspondant 
n'etait pas exprime dans les cellules de Tendosperme ou que la proteine 
N13yZ etait degradee. Des ARNs des endospermes transformes avec les 
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ADNs codant pour les proteines H45yZ et N13yZ ainsi que les ARNs des 
endospermes non transformes ont ete analyses. A partir des ARNs totaux, 
les ADNc ont ete prepares et amplifies par PCR en utilisant des amorces 
specifiques. La Fig. 6B montre I'analyse en Southern blot de trois 
5 echantillons d'ADNc hybrides avec un oligonucleotide codant pour une 
sequence K(Pro-Lys)< utilisee comme sonde. Les resultats indiquent que le 
gene N13yZ etait correctement exprime (Fig. 6B, ligne 3). La presence de 
bandes dans les echantillons H45yZ et N13yZ, mais pas dans les 
endospermes non transformes, a suggere que la proteine N13yZ etait 
10 degradee pendant les 24 heures de I'incubation. A partir de ces 
observations, les inventeurs ont conclu que le site d'insertion des 
sequences riches en lysine etait critique pour la stabilite de la y-zeine 
modifiee. 

15 La y-zeine enrichie en lysine est accumulee dans le corps proteioues 

En dehors de la teneur en lysine des sequences Pro-X, les 
proteines P20yZ, H30yZ et H45yZ avaient des caracteristiques communes 
avec la y-zeine de type sauvage : le peptide signal, le domaine repete en 

20 tandem N-terminal et la region riche en cysteine C-terminale etaient 
apparentees. II a semble important de determiner si ces domaines 
restaient totalement fonctionnels preservant le ciblage et la formation des 
corps proteiques ou si les sequences riches en lysine creaient un 
environnement special dans lequel ces proprietes pouvaient etre 

25 perturbees. Pour tester ceci, on a investigue si les y-zeines modifiees 
etaient capables de s'accumuler dans les corps proteiques. Un 
fractionnement sub-cellulaire a ete realise avec les endospermes 
transformes. Les homogenats d'endospermes bombardes ont ete charges 
sur des gradients de sucrose discontinus (20 %, 50 % et 70 % de sucrose) 
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et toutes les fractions collectees ont ete analysees par immunoblotting. 
P20yZ, H30yZ et H45yZ sedimentes sur la fraction des corps prot6iques et 
aucune quantite significative de ces proteines n'a ete detectee, soit dans le 
surnageant, soit dans la fraction microsomale (Fig. 7A, lignes 2, 2 et 3). 

5 Bien que dans les experiences faites prealablement in-vitro (Fig. 4A) aient 
permis de constater que les y-zeines modifiees nouvellement synthetisees 
subissaient une translocation dans les microsomes canins, on a teste ici si 
les proteines modifiees exprimees in-vivo dans des cellules d'ehdosperrne, 
subissaient une translocation dans la membrane du reticulum 

10 endoplasmique et restaient a I'interieur des corps proteiques derives du 
reticulum endoplasmique. Pour cette raison, des corps proteiques isoles 
ont 6te soumis a une digestion par la proteinase K dans des tampons 
isotoniques (contenant 20 % de sucrose) ou apres un choc osmotique 
dans I'eau (Fig. 7B). Les proteines protegees contre la degradation 

15 proteolytique par des enzymes peuvent etre entourees par une membrane 
et un traitement par des solutions detergeantes ou hypotoniques a resulte 
dans la digestion des proteines (Walter et Blobel, 1983, Method Enzymol. 
96, 84-93). Une comparaison des intensites de bandes, apr£s digestion 
par la proteinase K dans des milieux comprenant du sucrose ou de I'eau, a 

20 permis de reveler que les proteines P20yZ, H30yZ et H45yZ 6taient 
protegees de la digestion dans des tampons isotoniques (lignes 1, 3 et 5) 
mais etaient partiellement digerees dans I'eau (lignes 2, 4 et 6). 

L'expression des genes modifies de la y-zeine dans les cellules de 
la couche du sub-aleurone de I'endosperme par bombardement biolistique 

25 a permis d'observer que des y-zeines riches en lysines 6taient largement 
accumulees a Texception du cas ou les sequences riches en lysine etaient 
positionnees 5 residus en amont de I'extremite C-terminale du polypeptide 
de la Y-zeine. A partir de cette expression et rfetudes 
immunocytochimiques sur des corps proteiques isoles, les inventeurs ont 
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demontre que des y-zeines riches en lysine sont correctement accumulees 
dans ces organites et sont co-localisees avec les proteines endogenes y- 
zeine et a-zeine. 

Des corps proteiques isoles a partir des endospermes P20y2 ont ete 
examines par marquage de type immunogold et microscopie electronique. 
Sur des sections ultra fines incubees avec I'anticorps ccP-L (Fig. 8A), le 
marquage a I'or a ete detecte a I'interieur des corps proteiques, indiquant 
que la proteine P20y2 riche en lysine etait accumulee a I'interieur de ces 
organites. Dans des sections incubees seulement avec I'anticorps aP-L, 
I'immunomarquage avait lieu uniquement sur quelques corps proteiques 
(contenant la y-zeine riche en lysine), la plus grande partie des corps 
proteiques isoles n'etait pas immunomarquee avec des anticorps aP-L 
parce qu'ils correspondaient a des cellules d'endosperme non 
transformees. Pour determiner si la y-zeine riche en lysine etait co- 
localisee avec les polypeptides cc-zeines et y-zeines, un double marquage 
en immuno-electromicroscopie a ete realise sur des corps proteiques 
isoles en utilisant les anticorps ccZ et aP-L (Fig. 8B) et aG2 et aP-L 
(Fig. 8C et D). La figure 8B montre une micrographie de la section 
transversale de deux corps proteiques marques avec I'anticorps aP-L 
(particule d'or de 15 nm) et avec I'anticorps ccZ (particule d'or de 5 nm). Le 
resultat de I'immunocoloration a montre que la proteine P20yZ est 
accumulee dans les corps proteiques et co-localisee avec I'ct-zeine (voir 
I'etendue du marquage de I'a-zeine sur toute la surface du corps 
proteique). Par ailleurs, des sections tangentielles (Fig. 8B. voir les 
fleches) et transversales (Fig. 8D) des corps proteiques ont ete incubees 
avec I'anticorps aP-L (particule d'or 15nm) et avec I'anticorps aG2 
(particule d'or de 5 nm). Dans les deux cas, la proteine P20yZ etait co- 
localisee avec les polypeptides y-zeines. On a pu noter que les sections 
tangentielles du corps proteique (Fig. 8A, C, voir les fleches) etaient 
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facilement distinguees des sections transversales du corps proteique dans 
la mesure ou les premiers presentaient une densite plus forte en electrons 
et que le marquage de la y-zeine etait etendu sur toute la section. Au 
contraire les sections transversales presentaient une densite inferieure et 
5 le marquage de la y-zeine etait localise sur la membrane entourant le corps 
proteique. Dans les deux cas, la localisation du marquage de la y-zeine 
riche en lysine suivait celle de la y-zeine endogene. 

B) Preparation de plantes qen6tiquement modifies, exprimant des 
10 y- z6ines riches en lysine 

1) Obtention et utilisation de cal de mats comme cible pour la 
transformation q6n6tique. 

15 La transformation genetique du mais, quelle que soit la methode 

employee (electroporation; Aarobacterium . microfibres, canon a particules) 
requiert generalement Tutilisation de cellules indifferenciees en divisions 
rapides ayant conserve une aptitude a la regeneration de plantes entieres. 
Ce type de cellules compose le cal friable embryogene (dit de type II) de 

20 ma'is. 

Ces cals sont obtenus a partir d'embryons immatures de genotype 
Hi II ou (A188 x B73) selon la methode et sur les milieux decrits par 
Armstrong (Maize Handbook ; (1994) M. Freeling, V. Walbot Eds ; pp 665- 
671). Les cals ainsi obtenus sont multiplies et maintenus par repiquages 
25 successifs tous les quinze jours sur le milieu d'initiation. 

Des plantules sont ensuite regenerees a partir de ces cals en 
modifiant I'equilibre hormonal et osmotique des cellules selon la methode 
d6crite par Vain et al. (Plant Cell Tissue and Organ Culture (1989 18 : 143- 
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151). Ces plantes sont ensuite acclimatees en serre ou elles peuvent etre 
croisees ou autofecondees. 

2 ) Utilisation du cano n a particules pour la transformation 
5 aenetloue du mate. 

Le paragraphe precedent decrit I'obtention et la regeneration des 
lignees cellulaires necessaires a la transformation ; on decrit ici une 
methode de transformation genetique conduisant a Integration stable des 

10 genes modifies dans le genome de ia plante Cette methode repose sur 
('utilisation d'un canon a particules identique a celui decrit par J. Finer 
(Plant Cell Report (1992) 11 :323-328) ; les cellules cibles sont des 
fragments des cals decrits dans le paragraphe 1. Ces fragments d'une 
surface de 10 a 20 mm 2 ont ete disposes, 4h avant bombardement. a 

15 raison de 16 fragments par boite au centre d une boite de petri contenant 
un milieu de culture identique au milieu d'initiation. additionne de 0,2 M de 
mannitol + 0.2M de sorbitol. Les plasmides portant les genes a introduire 
sont purifies sur colonne Qiagen® en suivant les instructions du fabricant. 
lis sont ensuite precipites sur des particules de tungsten (M10) en suivant 

20 le protocole decrit par Klein (Nature (1987) 327 : 70-73). Les particules 
ainsi enrobees sont projetees vers les cellules cibles a I'aide du canon et 
selon le protocole decrits par J. Finer (Plant Cell Report (1992) 11 : 323- 
328). 

Les boites de cals ainsi bombardees sont ensuite scellees a I'aide 
25 de Scellofrais® puis cultivees a I'obscurite a 27°C. Le premier repiquage a 
lieu 24h apres, puis tous les quinze jours pendant 3 mois sur milieu 
identique au milieu d'initiation additionne d'un agent selectif dont la nature 
et la concentration peuvent varier selon le gene utilise (voir paragraphe 3). 
Les agents selectifs utilisables consistent generalement en composes 
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actifs de certains herbicides (Basta®, Round up®) ou certains 
antibiotiques (Hygromycine, Kanamycine...). 

On obtient apres 3 mois ou parfois plus tot, des cals dont la 
croissance n'est pas inhibee par I'agent selectif, habituellement et 
5 majoritairement composes de cellules resultant de la division d'une cellule 
ayant integre dans son patrimoine genetique une ou plusieurs copies du 
gene de selection. La frequence d'obtention de tels cals est d'environ 0,8 
cat par boite bombardee. 

Ces cals sont identifies, individualises, amplifies puis cultives de 
10 fa?on a regenerer des plantules (cf. paragraphe 1). Afin d'eviter toute 
interference avec des cellules non transformees toutes ces operations sont 
menees sur des milieux de culture contenant I'agent selectif. 

Les plantes ainsi reg6nerees sont acclimatees puis cultivees en 
serre ou elles peuvent etre croisees ou autofecondees. 

15 

3) Utilisation du gene Bar pour la production plantes de mais 
q6n6tiquement modifiees avant incorporS et exprimant le gfene H45vZ 

Le gene Bar de Streptomyces hygroscopicus code pour une 
20 phosphinotricine acyl transferase (PAT) qui inactive par acetylation la 
phosphinotricine-molecule active de Therbicide Basta®. Les cellules 
portant ce gene sont done rendues resistantes a cet herbicide et peuvent 
etre selectionnees par son intermediaire. Pour la transformation des 
cereales la sequence codante du gene Bar est sous le controle d'une 
25 region regulatrice permettant une expression forte et constitutive dans les 
cellules vegetales. Une telle region est avantageusement constitute par le 
promoteur et le premier intron du gene Actine de riz tels que decrits par Mc 
Elroy (Mol. Gen. Genet. (1991) 231 : 150-160). 

Ce gene chimerique est clone sur un plasmide permettant son 
30 amplification par Escherischi a coli. Ce plasmide (pDM 302 Cao (Plant Cell 
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Report (1992) 1 1 :586-591) apres amplification puis purification sur colonne 
Qiagen® peut etre utilise en transformation genetique du mais en utilisant 
par exemple la methode decrite dans I'exemple precedent. Dans ce cas les 
milieux de culture destines a la selection des cellules transformees sont 
5 additionnes de 2 mg/L de Phosphinotricine. 

Pour I'introduction du gene H45yZ une technique dite de 
cotransformation est avantageusement utilisee : les genes de selection 
(Bar) et d'interet (H45yZ) sont portes par des plasmides independants. 
Dans le cas de I'utilisation du canon a particules on procede a une 

10 coprecipitation des plasmides sur les particules de tungstene, la quantite 
totale d'ADN precipite sur les particules restant identique a ce qu'elle est 
dans le protocole standard (5ug d'ADN pour 2,5 mg de particules) chaque 
plasmide representant environ la moitie du poids total d'ADN utilise. 

L'experience montre qu'avec cette methode, la cointegration des 

15 plasmides dans les cellules vegetales est I'evenement le plus frequent (de 
I'ordre de 90%) c'est-a-dire que pratiquement chaque plante ayant integre 
le gene Bar et selectionnee par son intermediaire portera aussi le gene 
H45y2. Le niveau de coexpression (pourcentage de plantes selectionnees 
exprimant le gene H45yZ) est habituellement de I'ordre de 70%. 

20 Les genes ainsi introduits sont generalement lies au sens 

genetique, le gene H45yZ peut ainsi avantageusement etre suivi dans les 
descendances grace a la resistance a ('herbicide qui lui est etroitement 
associee. 

La quantite de proteine modifiee est determinee par les methodes 
25 decrites dans I'exemple A, notamment par immunoblotting sur extraits 
proteiques de grains de mais immatures ou matures, preleves en pool sur 
des plantes resistantes au BASTA. 
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4) Exemple explicitant l'6tape d'introduction des transqenes et 
notamment du qfene codant pour la H4Sv2. pour la modification du 
phenotype opaque 2 du mais 

5 Amelioration de mais opaque 2 par retrogression du gene de y- 

zeine enrichie en lysine. 

Les plantes transformees decrites dans I'exemple precedent, 
presentent a la fois, une resistance au Basta et Texpression d'une y-z6ine 
enrichie en lysine sont utilisees. Leur pollen est utilise pour feconder les 

io plantes de mats opaque 2 de la lignee W64Ao2 qui ne contient qu'un seul 
g6ne y-zeine. Cette lignee a 6te obtenue aupres du Maize Stock Center. 
Les plantes de ces descendances F1 sont selectionnees pour leur 
resistance au Basta et ensuite autofecondees. Les graines F2 ainsi 
produites sont analysees pour le phenotype opaque sur une table 

15 lumineuse et les grains opaque ou les grains vitreux sont semes et evalues 
pour la resistance au Basta. Dans le cas ou tous les grains opaques sont 
sensibles au Basta, la demonstration est faite que Introduction du gene y- 
zeine enrichi en lysine dans la plante consideree, complemente le 
phenotype opaque 2. 

20 Dans un deuxieme temps, dans ces plantes Basta resistantes, des 

individus de genotype o2/o2 et ne possedant qu'un seul gene y-zeine sur 
le chromosome 7 sont selectionnes a Taide des sondes moleculaires 
codant pour le gene Opaque 2 et pour la y-zeine. Ces dernieres rev6lant 
des fragments de restriction polymorphes et seuls les individus presentant 

25 le patron type de la lignee W64o2 sont retenus (Lopes M.A. et al, 1995, 
Mol. Gen. Genet. 19 : 247, 603-613). 

Ces individus ont un contenu en lysine qui est en moyenne 
equivalent a celui du mais o2, voire superieur. A partir de ces individus, 
toute introgression dans des varietes ELITE, du caractere « forte teneur en 
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lysine » est observee via la determination de la resistance au BASTA et de 
la presence de ('allele o2 detectee par RFLP. 

5 ) Expression de v-z6i nes enrichies en lysine dans Arabidopsis 
thaliana. 

Pour obtenir une transformation stable, les constructions 
plasmidiques P20yZ et pH30y2 donees dans le plasmide Bluescript KS (-) 
ont ete inserees sous forme de fragments Hincll/Xbal dans le vecteur 
binaire pBin19 (Bevan, M. Nucl. Acids Res. 12: 8711-8721 (1984)), 
contenant le promoteur 35S du virus de la mosaique du chou-fleur (CaMV) 
et les signaux de formation de I'extremite 3" et de polyadenylation du gene 
de I'octopine synthetase (ocs). Les nouveaux plasmides ont ete appeles 
p1 9P20yZ et p1 9H30yZ (figure 12). 

Les vecteurs binaires contenant les sequences codant pour les 
proteines P20yZ et H30yZ (p19P20yZ et P 19H30yZ) ont ete transfers dans 
la souche LBA4404 d'Aorobacteri um tumefaciens Des plantes Arabidopsis 
ecotype RLD ont ete transformees selon la methode decrite par Valvekens, 
D.. Van Montagu, M. et Van Lijsebettens, M ((1988) Proc. 
Natl.Acad.Sci.USA 85: 5536-5540). Pour chaque construction, 10 plantes 
transgeniques ont ete criblees par analyse en immunoblot en utilisant un 
antiserum obtenu contre la y-zeine (<xG2, Ludevid et al. 1985). Les plantes 
contenant les taux les plus eleves (correspondant a environ 0,1% de la 
quantite totale de proteines presentes dans les feuilles d'Arabidopsis) de 
produits transgeniques dans la generation F1, ont ete choisies pour obtenir 
la generation F2. Ces plantes ont egalement ete selectionnees pour 
I'expression de la proteine recherchee. 

Des plantes transgeniques entieres, selectionnees dans un milieu 
contenant de la kanamycine ont ete homogeneisees dans de I'azote 
liquide. Les proteines transgeniques ont ete extraites selectivement avec 
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une solution contenant de I'ethanol/ de I'acide chlorhydrique HCI 0,125 N 
dans une proportion de 3:1 (v/v), avec 5% de mercaptoethanol et 
d'inhibiteurs de protease. Les proteines extraites avec cette solution ont 
ete precipitees dans 5 volumes d'acetone et analysees par SDS-PAGE et 

5 immunoblotting. Les extraits proteiques des plantes non transgeniques ont 
ete utilises en tant que controles. Les proteines resultant de I'insertion des 
sequences K(P-K) 4 dans la y-zeine ont ete exprimees correctement dans 
les plantes Arabidopsis thaliana en utilisant le promoteur constitutif 35 S 
du CaMV. Sur les immunoblots, les anticorps aG2 et aPL reconnaissaient 

10 des bandes d'electrophorese correspondant aux proteines P20yZ et 
H30yZ. Ces bandes migraient avec des masses moleculaires apparentes 
conformes a celles que Ton avait prealablement observees dans les 
experiences de traduction / translocation in vitro (30 kD et 26 kD 
respectivement). Comme on I'a observe dans les plantes transgeniques 

15 Arabidopsis exprimant la y-zeine (Geli et al. Plant Cell 6: 1911-1922 
(1994)), les proteines P20yZ et H30yZ migraient sous la forme de deux 
bandes d'electrophorese a savoir les bandes correspondant a 36 et 30 kD 
pour P20yZ et les bandes correspondant a 32 et 26 kD pour H30yZ. Les 
bandes superieures pourraient correspondre a des produits ayant subi des 

20 modifications post-traductionnelles. Une telle modification post- 
traductionnelle n'a pas ete detectee dans les endospermes de mais 
transformes. Ce resultat suggere que la modification apparaitrait lorsque 
ces proteines sont exprimees dans un systeme heterologue tel que 
Arabidopsis thaliana . 

25 

6) Expression de v-zeines enrichies en lysine recombinantes dans 

du maYs 

M6thode: 
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Apres obtention des plantes transgeniques, on les croise avec une 
lignee male non transformee. Par consequent, 50% des grains recoltes 
dans ce cas d'insertion unilocus seront transgeniques. Dans le but 
d'analyser les y-zeines enrichies en lysine dans les plantes transgeniques, 
5 les proteines sont extraites a partir de 6 grains par transformant. 

Les endospermes sont disseques en retirant des grains les 
embryons et les pericarpes. Les endospermes sont broyes et 50mg de 
farine sont utilises pour I'extraction selective. Prealablement les ot-zeines 
sont extraites par 3 traitements avec de Pethanol a 70%. Apres 

10 centrifugation, I'ethanol est evapore sous vide. Les proteines insoiubles 
dans I'ethanol (principalement les y-zeines et les y-zeines enrichies en 
lysine) sont extraites du culot avec un tampon de Laemli contenant 10% de 
mercaptoethanol (100pl de tampon pour 10mg de farine). Les proteines 
totales sont ensuite analysees par coloration a I'argent (Morrissey J.H. 

15 1981, Ann. Biochem. vol. 117, p. 307-310). Les y-zeines et les y-zeines 
enrichies en lysine sont analysees par immunoblot en utilisant 
respectivement les anticorps aG2 (dilution 1/2000) et otPL (dilution 1/500). 
Un anticorps anti-anticorps de lapin conjugue a la phosphatase alcaline est 
utilise comme anticorps secondaire dans I'immunoblot. Les extraits sont 

20 dilues pour permettre leur chargement sur SDS-page selon la methode 
analytique utilisee. 
Resultats : 

Accumulation de v-zeines enrichies en lysine dans les plants 20vZ et 45vZ 
de maTs transqenique : 
25 La figure 13 montre Timmunoblot des extraits de proteines revelees 

avec Tantiserum aPL (A.B) et les proteines totales apres coloration a 
Targent (C). Comme on peut le voir dans la fig13A, 6 plants transgeniques 
20yZ ont ete testes avec Tantiserum aPL et de la y-zeine enrichie en lysine 
est exprimee dans les plants transgeniques A1 et D2 (pistes 1 et 6 
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respectivement). Dans le plant C1 (piste 4), seules des traces de y-zeine 
enrichie en lysine sont observees. Lorsque les extraits des 6 plants 
transgeniques 45yZ sont charges sur le gel et marques avec I'antiserum 
aPL (Fig 13B), on observe une forte reaction avec I'anticorps pour les 
5 transformants B1 et C1 (pistes 3 et 4 respectivement). 

II faut noter que la reaction avec I'anticorps dans les extraits des 
endospermes des plants 45yZ B1 et C1 est plus forte que dans les extraits 
des plants 20yZ A1 et D2. Ce resultat est confirme apres coloration a 
I'argent des gels (fig 13C) ou les 2 types de y-zeine : endogene et enrichie 

to en lysine, sont colores. La y-zeine enrichie en lysine a un poids 
moleculaire apparent de 30kDa et la y-zeine endogene de 28 kDa. 
L'expression de y-zeine enrichie en lysine est plus faible dans le plant 45yZ 
B1 que dans C1 (pistes 2 et 3 respectivement). Dans les pistes 1 a 6 de la 
Fig 13C, une dilution identique des proteines des extraits d'endospermes 

15 des plants 45yZ et 20yZ avait ete deposee sur le gel. A cette dilution , 
l'expression de la y-zeine enrichie en lysine est detectee seulement dans 
les endospermes des plants 45yZ B1 et C1. Cependant, lorsqu'un extrait 
plus important (40 ug de proteines par piste) de proteines 20yZ est charge 
sur le gel, une legere bande (voir fleche), correspondent a la y-zeine 

20 enrichie en lysine est detectee dans les endospermes 20yZ A1 et D2. Ce 
resultat indique que les plants 45yZ accumulent beaucoup plus de 
proteines selon ('invention que les plants 20yZ. Ceci est probablement du 
aux activites differentes des promoteurs. Les plantes 45yZ ont ete 
transformees avec un construit contenant la y-zeine selon ('invention sous 

25 le contr6le du promoteur y-zeine (1 ,7 kb) alors que les plantes 20yZ ont ete 
transformees avec la meme sequence codante mais sous le controle du 
promoteur 35S du CaMV. La coloration a I'argent est une technique 
generate de coloration des proteines, mais la forte couleur marron est 
surtout observee en presence de proteines basiques. Comme les ct-zeines 
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ont ete extraites de la farine, comme decrit ci-dessus, elles sont absentes 

lors de I'analyse en SDS-page de la Fig 13C. 

Segregation 

Puisqu'il y a une segregation de 50% dans toutes les plantes 
5 transgeniques dans le cas d*un locus unique, une analyse grain par grain a 
ete realisee afin de quantifier le taux de y-zeine enrichie en lysine dans 
chaque transformant. L'analyse a ete faite uniquement avec les 
transformants 45yZ qui presentaient le plus fort taux d'expression. La 
figure 14 montre la coloration a I'argent (A) et I'immunoblot avec aPL (B) 

to de 5 endospermes differents de 45yZ B1 et C1. La faible bande 
electrophoretique presente sur toutes les pistes (voir A. pistes 1 a 10) 
correspond a la y-zeine endogene. Comme on peut le voir dans la Fig 14 
A, 2 des 5 endospermes accumulent de la y-zeine enrichie en lysine (voir 
pistes 3,4 et 6,7). Par consequent, environ la moitie des graines 

15 accumulent des quantites significatives de proteines enrichies en lysine. Si 
on prend en compte le fait que des quantites identiques de prolines ont 
ete deposees sur le gel, on observe que le transformant 45yZ C1 a 
accumule plus de y-zeine enrichie en lysine que B1 . En fait ce resultat est 
en accord avec ce qui est observe lors de la coloration a I'argent des 

20 extraits melanges d'endosperme (Fig 13 C, piste 3). La preuve de la 
presence de y-zeine enrichie en lysine dans ces endospermes est 
soulignee dans la Fig 14B. L'immunoblot utilisant I'antiserum aPL montre 
que 2 extraits d'endosperme de 45yZ B1 (pistes 3 et 4) et de 45yZ C1 
(pistes 4 et 6) accumulent de la y-zeine enrichie en lysine. Pour confirmer 

25 le pourcentage de grains transgeniques, 10 nouveaux grains de 
transformant 45yZ C1 ont ete analyses par immunoblot et utilisation de 
I'antiserum aPL (Fig 15 A). Comme attendu, environ la moitie des graines 
transgeniques sont detectees. Une bande immunoreactive a ete observee 
dans les extraits d'endosperme (pistes 1,2,9 et 10). 
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Estimation de la quantite de v-zeines enrichies en lysine dans les 
endospermes des transformants 45vZ : 

<xG2 est un antiserum polyclonal qui reconnait les y-zeines 
5 endogenes et les y-zeines enrichies en lysine. La reactivit6 de cet 
antiserum avec les extraits d'endospermes 45yZ C1 a ete utilisee pour 
quantifier la quantite de y-zeines enrichies en lysine selon I'invention dans 
les endospermes des plantes transformees. 

La figure 15B presente Timmunoblot de 5 extraits proteiques 
10 correspondant a 5 endospermes 45y2 C1 (pistes 1 a 5). Comme attendu, 
seuls 2 endospermes ont presente un profil d'immunoreaction 
caract6ristique des grains transgeniques. La bande superieure de 30 kDa 
correspond a la y-zeine enrichie en lysine (fleches sur piste 1 et 2) et la 
bande inferieure a la y-zeine endogene. On peut noter que dans les 
is endospermes des plantes non transgeniques la bande superieure est 
absente (pistes 3, 4 et 5). De fa?on surprenante, il semble que le contenu 
en y-zeine endogene est plus faible dans les extraits des plantes 
transgeniques que dans les plantes non-transgeniques (voir fleches sur 
pistes 1 et 5). 
20 A premiere vue, il a ete observe que : 

i) dans les endospermes transgeniques 45yZ C1, le ratio y-zeine enrichie 
en lysine/y-zeine endogene est de 7/3. Done la quantite de proteine 
modifiee selon I'invention est au moins 2 fois plus importante que celle 
de la proteine endogene, 
25 ii) la quantite de y-zeine endogene dans les endospermes non 
transgeniques (voir pistes 3, 4 et 5) etait equivalente a celle de la y- 
zeine enrichie en lysine dans les endospermes transgeniques (voir 
pistes 1 et 2). 
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7 ) Expressi on de v-z6ines enrichies en lysine recombinantes dans 
du ble 

Comme dans I'exemple 6), il est possible de montrer la presence de 
y-zeines enrichies en lysine selon I'invention dans du ble. 
5 La transformation du ble peut notamment etre effectuee selon la methode 
decrite dans Weeks et al., 1993, Plant Physiol., vol 102 : pages 1077-1084 
ou selon la methode decrite dans EP709462. 
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REVINDICATIONS 

1. Oligonucleotide comprenant au moins un enchainement 
5 codant pour un polypeptide repondant a la formule (P-K) m dans laquelle : 

• n est un entier superieur ou egal a 2, 

- P represente un residu d'acide amine Proline, 

• K represente un residu d'acide amine Lysine, 

- le signe "-" symbolise une liaison entre les deux residus d'acides 
10 amines et notamment une liaison de type peptidique, les n unites (P-K) 

etant liees entre elles egalement par de telles liaisons par exemple de type 
peptidique. 

2. Oligonucleotide selon la revendication 1, comprenant un 
enchainement codant pour un polypeptide repondant a la formule (P-K) n , 

15 dans laquelle n est un entier superieur ou egal a 3, de preference n est 
egal a 4, 5, 6, 7, 8, 9, 10ou15. 

3. Oligonucleotide selon la revendication 1 ou la 
revendication 2, comprenant un enchainement codant pour un polypeptide 
repondant a la formule (P-K) n , dans laquelle la sequence des n unites (P- 

20 K) est interrompue par un ou plusieurs residus d'acides amines differents 
des residus P ou K. 

4. Oligonucleotide selon Tune quelconque des revendications 1 
a 3, caracterise en ce que I'enchainement codant pour le polypeptide 
comprenant les n unites (P-K) est complete a son extremite 5' et/ou a son 

25 extremite 3\ par un ou plusieurs codons, codant par exemple pour au 
moins un residu lysine a I'extremite N-terminale du polypeptide form6. 

5. Oligonucleotide selon la revendication 4, caracterise en ce 
qu'il code pour un polypeptide repondant a la formule (P-K), a la formule 
K(P-K) 4 ou a la formule 2K (P-K) 4 . 
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6. Sequence de nucleotides recombinant comprenant un 
enchainement de nucleotides codant pour une proteine de reserve d'une 
plante, caracterisee en ce qu'elle comprend en outre un oligonucleotide 
selon I'une quelconque des revendications 1 a 5, insere en un site de 

5 I'enchalnement de nucleotides choisi de facon telle que : 

- I'expression de la sequence de nucleotides dans une cellule 
vegetale determinee permet d'obtenir une proteine de reserve modifiee 
localisee de facon identique ou similaire a la proteine de reserve normale 
qui serait exprimee dans les memes conditions dans la meme cellule par 

10 I'enchainement de nucleotides codant correspondant, et/ou 

- la proteine de reserve modifiee codee par la sequence de 
nucleotides recombinant est reconnue immunologiquement par des 
anticorps produits contre la proteine de reserve normale correspondante. 

7. Sequence de nucleotides selon la revendication 6, 

is caracterisee en ce que I'enchainement de nucleotides codant qu'elle 

comprend, code pour une proteine de reserve naturellement pauvre en 
lysine. 

8. Sequence de nucleotides selon la revendication 7, 
caracterisee en ce que I'enchainement de nucleotides codant qu'elle 

20 comprend, code pour une proteine de reserve naturellement produite par 
une plante utilisable en alimentation animale ou humaine. 

9. Sequence de nucleotides selon la revendication 7 ou la 
revendication 8, caracterisee en ce que I'enchainement de nucleotides 
codant qu'elle comprend, code pour une proteine de reserve naturellement 

25 produite par une plante de la famille des cereales. 

10. Sequence de nucleotides selon la revendication 7 ou la 
revendication 8, caracterisee en ce que I'enchainement de nucleotides 
codant qu'elle comprend, code pour une proteine de reserve naturellement 
produite par une plante de la famille des legumineuses ou des cruciferes. 
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11. Sequence de nucleotides selon la revendication 9, 
caracterisee en ce que Tenchalnement de nucleotides codant qu'elle 
comprend, code pour une proteine de reserve de mais. 

12. Sequence de nucleotides selon la revendication 11, 
5 caracterisee en ce que renchainement de nucleotides codant qu'elle 

comprend, code pour une proteine de reserve de la famille des zeines. 

13. Sequence de nucleotides selon la revendication 12, 
caracterisee en ce que I'enchainement de nucleotides codant qu'elle 
comprend, code pour une proteine de reserve est la y-zeine du mais. 

10 14. Sequence de nucleotides selon la revendication 1 3, 

caracterisee en ce que I'enchainement de nucleotides codant pour la y- 
zeine de mais qu'elle contient, repond a la sequence presentee sur la 
Figure 9. 

15. Sequence de nucleotides selon la revendication 7 ou la 
15 revendication 8, caracterisee en ce que I'enchainement de nucleotides 

codant qu'elle comprend, code pour une proteine de reserve d'une plante 
choisie parmi les suivantes : le soja, le tournesol, le tabac, le ble, I'avoine, 
la luzerne, le riz, le colza, Arabidopsis thaliana . 

16. Sequence de nucleotides selon la revendication 13 ou la 
20 revendication 14, caracterisee en ce que ('oligonucleotide est insere a la 

place ou a la suite du domaine Pro-X ou dans le domaine Pro-X 
naturellement present dans la y-zeine du mais. 

17. Sequence de nucleotides recombinante, caracterisee en ce 
qu'elle comprend une sequence de nucleotides selon Tune quelconque des 

25 revendications 1 a 16 sous le controle d'un promoteur d'expression. 

18. Sequence de nucleotides recombinante selon la 
revendication 17, caracterisee en ce que le promoteur est un promoteur 
specifique d'un tissu cellulaire determine, par exemple un promoteur 
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specifique pour I'expression dans les graines, et/ou dans les feuilles de 
plantes. 

19. Sequence de nucleotides selon la revendication 17, 
caracterisee en ce que le promoteur d'expression est celui de la y-zeine du 

5 mai's. 

20. Sequence de nucleotides selon la revendication 17, 
caracterisee en ce que le promoteur d'expression est le promoteur 
CaMV35S. 

21. Sequence de nucleotides selon I'une quelconque des 
io revindications 16 a 20, caracterisee en ce qu'elle code pour Tun des 

polypeptides P20yZ ou PH45yZ repondant respectivement aux sequences 
representees aux figures 11 et 10. 

22. Vecteur de clonage et/ou d'expression, caracterise en ce qu'il 
comprend. en un site non essentiel pour sa replication, une sequence de 

15 nucleotides selon I'une quelconque des revendications 1 a 20. 

23. Vecteur de clonage et/ou d'expression, caracterise en ce qu'il 
s'agit de Tun des plasmides pP20yZ (CNCM N°l-1640), pH30yZ ou P H45yZ 
(CNCM N p 1-1639). 

24. Polypeptide code par une sequence selon I'une quelconque 
20 des revendications 1 a 17. 

25. Y-zeine de mais modifiee riche en lysine, caracterisee en ce 
qu'elle est codee par la sequence de nucleotides selon la revendication 13 
ou 14. 

26. y-zeine de mais modifiee enrichie en lysine, caracterisee en 
25 ce que sa sequence d'acides amines est modifiee par au moins un 

polypeptide repondant a la formule (P-K) n ou a la formule K-(P-K) n , dans 
laquelle : 

- n est un entier superieur ou egal a 2, 

- P represente un residu d'acide amine Proline, 
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- K represente un residu d'acide amine Lysine, 

- le signe "-" symbolise une liaison entre les deux residus d'acides 
amines et notamment une liaison de type peptidique, les n unites (P-K) 
etant liees par des liaisons notamment de type peptidique, ledit 

5 polypeptide repondant a la formule (P-K) n ou K-(P-K) n etant substitue £ une 
sequence naturellement presente dans la y-zeine de mais normale ou 
6tant insere avec deletion d'un ou plusieurs acides amines de la sequence 
d'acides amines de la y-zeine de mais normale, ou etant ajoute dans la 
sequence decides amines de la y-zeine normale, le site d'insertion du 

10 polypeptide etant choisi de fagon telle que : 

- lorsque la y-zeine modifiee riche en lysine est produite dans une 
cellule hote, notamment une cellule vegetale, elle est localisee de fagon 
identique ou similaire a la y-zeine de mais normale qui serait produite dans 
les memes conditions, dans la meme cellule hote, et/ou, 

is - la y-zeine de ma'fs modifiee est reconnue par des anticorps diriges 

contre la y-zeine normale de mais. 

27. y-zeine de mais modifiee selon la revendication 26, 

caracterisee en ce qu'il s'agit de la proteine P20yZ ou de la proteine H30yZ 

ou de la proteine H45yZ. 
20 28. Cellule hote recombinante, caracterisee en ce qu'elle 

comprend une sequence de nucleotides selon Tune quelconque des 

revendications 1 a 17. 

29. Cellule hote selon la revendication 28, caracterisee en ce 
qu'il s'agit d'une bacterie, par exemple de E. coli ou Aarobacterium 

25 tumefaciens . 

30. Cellule hote selon la revendication 28, caracterisee en ce 
qu'il s'agit d'une cellule vegetale. 

31. Cellule hote selon la revendication 30, caracterisee en ce 
qu'il s'agit d'une cellule de semences de plante. 
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32. Cellule hote selon la revendication 31, caracterisee en ce 
qu'il s'agit d'une cellule d'endosperme de semences de mais. 

33. Cellule hote selon la revendication 32, caracterisee en ce 
quelle contient, integree de fa?on stable dans son genome, une sequence 

5 de nucleotides selon la revendication 13. 

34. Cellule hote selon la revendication 32, caracterisee en ce 
qu'elle produit une y-zeine de mais modifiee riche en lysine selon la 
revendication 26 ou la revendication 27 

35. Cellule hote selon la revendication 30, caracterisee en ce 
io qu'il s'agit d'une cellule de soja, de tournesol, de tabac, de ble, d'avoine, 

de luzerne, de riz, de colza, d' Arabidopsis . 

36. Semences produisant un polypeptide selon Tune quelconque 
des revendications 24 a 27. 

37. Plante produisant un polypeptide selon I'une quelconque des 
15 revendications 24 a 27. 

38. Plante selon la revendication 37, caracterisee en ce qu'il 
s'agit du mais. 

39. Semences obtenues a partir des plantes selon la 
revendication 37 ou 38. 

20 40 - Procede de production de plantes ou de semences exprimant 

une proteine de reserve modifiee, caracterise en ce qu'il comprend les 
etapes de : 

a) transformation d'une cellule vegetale, avec une sequence de 
nucleotides selon Tune quelconque des revendications 6 a 17, ou un 
25 vecteur selon I'une quelconque des revendications 22 ou 23, dans des 
conditions permettant ('expression de fa?on stable et fonctionnelle de la 
proteine de reserve modifiee codee par la sequence de nucleotides; 
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b) regeneration de plantes a partir de la cellule de plante 
transformee de I'etape a), pour obtenir des plantes exprimant la proteine 
de reserve modifiee, 

c) le cas echeant, obtention de semences a partir des plantes 
5 modifiees obtenues a I'etape b). 

41. Procede selon la revendication 40, caracterise en ce que la 
plante est le mats et la proteine de reserve est la y-zeine. 
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FIGURE 1 
FEUILLE DE REMPIACEMENT (REGLE 26) 
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FIGURE 2 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 97/28247 



3/17 



PCT/FR97/00167 



E 



E 
u 



(0 

O 

uj 5 
in ui 

uj o 
tr 2 

UJ yj 



O o 



N 1 


N 1 


N 




>• ; 




0 
















2 



a 1 

E i 

UJ S 
a. O 
o 



FEUILLE DE REMPLACEMENT (REGLE 26) 



C3 



WO 97/28247 



4/17 



PCT/FR97/00167 




FIGURE 4 




i 

I 



FIGURE 6 
FEUILLE DE REMPLACEMENT (REGLE 26) 
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FEUILLE DE REMPLACEMENT (REGLE 26) 
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FIGURE 7 



FEUILLE DE REMPLACEMENT (REGLE 26) 
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FEUILLE DE REMPLACEMENT (REGLE 26) 
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y-Z6ine 



10 20 30 40 50 60 

' I I I I | 

ATGAGGGTGTTGCTCGTTGCCCTCGCTCTCCTGGCTCTCGCTGCGAGCGCCACCTCCACG 
MRVLLVALALLALAASATST 

7 ° 80 90 100 110 120 

I I I I I | 

CATACAAGCGGCGGCTGCGGCTGCCAGCCACCGCCGCCGGTTCATCTACCGCCGCCGGTG 
HTSGGCGCQPpppvHLPPPv 

130 140 150 160 170 180 

' I I I I | 

CATCTGCCACCTCCGGTTCACCTGCCACCTCCGGTGCATCTCCCACCGCCGGTCCACCTG 
HLPPPVHLPPPVHLPPPVHL 

190 200 210 220 230 240 

I I I I I I 

CCGCCGCCGGTCCACCTGCCACCGCCGGTCCATGTGCCGCCGCCGGTTCATCTGCCGCCG 
PPPVHL PPPVHVPPPVHLPP 

250 260 270 280 290 300 

I I I I I I 

CCACCATGCCACTACCCTACTCAACCGCCCCGGCCTCAGCCTCATCCCCAGCCACACCCA 
PPCHYPTQPPRPQPHPQPHP 

310 320 330 340 350 360 

I I I I I | 

TGCCCGTGCCAACAGCCGCATCCAAGCCCGTGCCAGCTGCAGGGAACCTGCGGCGTTGGC 
CPCQQPHPSPCQLQGTCGVG 

370 380 390 400 410 420 

I I I I I | 

AGCACCCCGATCCTGGGCCAGTGCGTCGAGTTTCTGAGGCATCAGTGCAGCCCGACGGCG 
STPILGQCVEFLRHQCSPTA 

430 440 450 460 470 480 

I I I I | I 

ACGCCCTACTGCTCGCCTCAGTGCCAGTCGTTGCGGCAGCAGTGTTGCCAGCAGCTCAGG 
TPYCSPQCQSLRQQCCQQLR 

490 500 510 520 530 5 40 

I I I • | | , 

CAGGTGGAGCCGCAGCACCGGTACCAGGCGATCTTCGGCTTGGTCCTCCAGTCCATCCTG 
QVEPQHRYQAI FGLVLQS I L 



550 560 570 580 590 



600 



CAGCAGCAGCCGCAAAGCGGCCAGGTCGCGGGGCTGTTGGCGGCGCAGATAGCGCAGCAA 
QQQPQSGQVAGLLAAQIAQQ 

FIGURE 9 
FEUILLE DE REMPLACEMENT (REGLE 26) 
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FIGURE 9 (SUITE) 
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H45 y Z 
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I I I I I I 

ATGAGGGTGTTGCTCGTTGCCCTCGCTCTCCTGGCTCTCGCTGCGAGCGCCACCTCCACG 
MRVLLVALALLALAASATST 

70 80 90 100 110 120 

I I I I I I 

CATACAAGCGGCGGCTGCGGCTGCCAGCCACCGCCGCCGGTTCATCTACCGCCGCCGGTG 
HTSGGCGCQPPPPVHLPPPV 

130 140 150 160 170 180 

I I I I I I 

CATCTGCCACCTCCGGTTCACCTGCCACCTCCGGTGCATCTCCCACCGCCGGTCCACCTG 
HLPPPVHLPPPVHLPPPVHL 

190 200 210 220 230 240 

I I I I I I 

CCGCCGCCGGTCCACCTGCCACCGCCGGTCCATGTGCCGCCGCCGGTTCATCTGCCGCCG 
PPPVHLPPPVHVPPPVHLPP 

250 260 270 280 290 300 

I I I I I I 

CCACCATGCCACTACCCTACTCAACCGCCCCGGATCGAATTCAAACCAAAGCCAAAGCCG 
PPCHYPTQPPRIEFKPKPKP 

310 320 330 340 350 360 

I I I I I I 

AAGCCAAAAGAATTCAAACCAAAGCCAAAGCCGAAGCCAAAAGAATTCCTGCAGCCCCTG 
KPKEFKPKPKPKPKEFLQPL 

370 380 390 400 410 420 

I I I I I I 

CAGGGAACCTGCGGCGTTGGCAGCACCCCGATCCTGGGCCAGTGCGTCGAGTTTCTGAGG 
QGTCGVGSTPILGQCVEFLR 

430 440 450 460 470 480 

I I I I I I 

CATCAGTGCAGCCCGACGGCGACGCCCTACTGCTCGCCTCAGTGCCAGTCGTTGCGGCAG 
HQCSPTATPYCSPQCQSLRQ 

490 500 510 520 530 540 

I I I I I I 

CAGTGTTGCCAGCAGCTCAGGCAGGTGGAGCCGCAGCACCGGTACCAGGCGATCTTCGGC 
QCCQQLRQVEPQHRYQA1 FG 

550 560 570 580 590 600 

' I I I I | 

TTGGTCCTCCAGTCCATCCTGCAGCAGCAGCCGCAAAGCGGCCAGGTCGCGGGGCTGTTG 
LVLQSILQQQPQSGQVAGLL 

610 620 630 640 650 660 

■ I I I I I 

GCGGCGCAGATAGCGCAGCAACTGACGGCGATGTGCGGCCTGCAGCAGCCGACTCCATGC 
AAQIAQQLTAMCGLQQPTPC 

FIGURE 10 
FEUILLE DE REMPLACEMENT (REGLE 26) 
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FIGURE 10 (SUITE) 
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P20 yZ 
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I I I I I | 

ATGAGGGTGTTGCTCGTTGCCCTCGCTCTCCTGGCTCTCGCTGCGAGCGCCACCTCCACG 
MRVLLVALALLALAASATST 

70 80 90 100 110 120 

I I I I I | 

CATACAAGCGGCGGCTGCGGCTGCCAGCCACCGCCGCCGGTTCATCTACCGCCGCCGGTG 
HTSGGCGCQPPPPVHLPPPV 

130 140 150 160 170 180 

I I I I I | 

CATCTGCCACCTCCGGTTCACCTGCCACCTCCGGTGCATCTCCCACCGCCGGTCCACCTG 
HLPPPVHLPPPVHLPPPVHL 

190 200 210 220 230 240 

' I I I I | 

CCGCCGCCGGTCCACCTGCCACCGCCGGTCCATGTGCCGCCGCCGGTTCATCTGCCGCCG 
PPPVHLPPPVHVPPPVHLPP 

250 260 270 280 290 300 

' I I I I | 

CCACCATGCCACTACCCTACTCAACCGCCCCGGCCTCAGCCTCATCCCCAGCCACACCCA 
PPCHYPTQPPRPQPHPQPHP 

310 320 330 340 350 360 

I I I I I | 

TGCCCGTGCCAACAGCCGCATCCAAGCCCGTGCCAGATCGAATTCAAACCAAAGCCAAAG 
CPCQQPHPSPCQIEFKPKPK 

370 380 390 400 410 420 

• I I I I I 

CCGAAGCCAAAAGAATTCCTGCAGCCCCTGCAGGGAACCTGCGGCGTTGGCAGCACCCCG 
PKPKEFLQPLQGTCGVGSTP 

430 440 450 460 470 480 

I I I I I | 

ATCCTGGGCCAGTGCGTCGAGTTTCTGAGGCATCAGTGCAGCCCGACGGCGACGCCCTAC 
I LGQCVEFLRHQCSPTATPY 

490 500 510 520 530 540 

' I I I I | 

TGCTCGCCTCAGTGCCAGTCGTTGCGGCAGCAGTGTTGCCAGCAGCTCAGGCAGGTGGAG 
CSPQCQSLRQQC'CQQLRQVE 

550 560 570 580 590 600 

I I I I I | 

CCGCAGCACCGGTACCAGGCGATCTTCGGCTTGGTCCTCCAGTCCATCCTGCAGCAGCAG 
PQHRYQAI FGLVLQS I LQQQ 

610 620 630 640 650 660 

I I I I I | 

CCGCAAAGCGGCCAGGTCGCGGGGCTGTTGGCGGCGCAGATAGCGCAGCAACTGACGGCG 

PQSGQVAGLLAAQIAQQLTA 

FIGURE 11 
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FIGURE 11 (SUITE) 
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FEUILLE DE REMPLACEMENT (RE6LE 26) 
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FIGURE 14 
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